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Prefazione 


Esistono pochi termini che possono indurre una risposta emotiva come l’ingegneria 
genetica e il clonaggio. Frequentemente i giornali ed i media utilizzano questa ter- 
minologia per descrivere qualcosa che non è corretto, addirittura contro la natura. 
In effetti, l’ingegneria genetica e la modificazione dei geni nella maggior parte dei 
casi, portano alla mente immagini di cibi mostruosi e di animali anomali. Tuttavia, 
durante la lettura del libro, spero che i lettori siano in grado di apprezzare che l’in- 
gegneria genetica e le tecniche di biologia molecolare che sono alla sua base, rap- 
presentino strumenti essenziali per capire come funzionano gli organismi. L'uomo, 
attraverso gli incroci, ha giocato con i geni, seppure senza esserne cosciente, per 
centinaia di anni allo scopo di selezionare alcune caratteristiche desiderabili. Die- 
tro di noi ci sono cinquanta anni di conoscenza della struttura del materiale gene- 
tico, e, davanti a noi, la capacità di comprendere come ogni gene che possediamo 
risponda ad altri geni e all'ambiente. Per esempio, non è ancora possibile determi- 
nare la base biochimica della differente risposta ai farmaci di certi individui, ma 
abbiamo a disposizione le tecniche per affrontare il problema. L’eccitazione di en- 
trare nell’era post-genomica cammina di pari passo con la preoccupazione di cosa 
siamo in grado di fare, sia che lo stiamo facendo o no. 

L'analisi dei geni e dei genomi potrebbe facilmente ridursi ad un mero elenco 
di tecniche applicabili ad un particolare problema. Ho tentato di evitare questo er- 
rore e, quando possibile, ho utilizzato specifici esempi per illustrare il problema e 
le sue potenziali soluzioni. Per fare ciò, mi sono basato essenzialmente su lavori 
pubblicati ed ho tentato di riportare tutti i lavori basilari, in modo tale che i lettori 
interessati possano approfondire ulteriormente l’argomento. Questo mi ha anche 
permesso di collocare le idee e gli esperimenti in un contesto storico. Pensare che 
Watson e Crick siano stati i soli responsabili della nostra conoscenza di come fun- 
zionino i geni, è un’idea sbagliata piuttosto comune. Il loro contributo non deve 
mai essere sottovalutato, tuttavia è necessario considerare anche il lavoro di altri ri- 
cercatori. La sequenza completa del genoma umano ed anche di altri animali mo- 
dello, forniscono una grande opportunità per il progresso delle scienze biologiche 
nei prossimi anni. Molti esperimenti possono ora essere effettuati a livello di ge- 
noma completo e noi stiamo solo iniziando a comprendere le conseguenze di que- 
sta potenzialità. Uno dei maggiori problemi incontrati nello scrivere questo libro è 
stato quello di bilanciare la quantità e la complessità delle informazioni. Con que- 
sta finalità mi sono concentrato su diversi sistemi sperimentali disponibili, come 
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Escherichia coli per i procarioti ed il lievito per gli eucarioti. Inoltre, per gli euca- 
rioti superiori abbiamo preso in considerazione solo i mammiferi, in particolare 
l’uomo. Ciò con l’intenzione di fornire ai lettori non solo una varietà di idee e di 
esperimenti attualmente in corso di esecuzione, ma anche un background storico 
sul quale oggi tali esperimenti sono ancorati. Noi ignoriamo il passato a nostro ri- 
schio. Questo approccio ha, tuttavia, portato all’esclusione di alcuni altri sistemi, 
come ad esempio la Drosophila ed i procarioti diversi da E. coli, senza significare 
che questi campi non considerati siano di scarso interesse. Piuttosto che coprire 
tutti i campi con scarsi dettagli, o spiegare gli intricati dettagli e sfumature di solo 
alcuni, ho tentato di fornire un’ampia visione caratterizzata da esempi specifici. La 
valutazione della riuscita del giusto bilanciamento viene lasciata ai lettori. Con si- 
curezza posso affermare che non c’è mai stato un momento più eccitante di questo 
per studiare la biologia e spero che questo si evinca dalla lettura di questo libro. 


Richard J. Reece 
Università di Manchester 
Ottobre 2003 
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DNA: Struttura 
e funzione 


Concetti chiave 
+ L'informazione genetica è contenuta all’interno degli acidi nucleici 
+ II DNA è una doppia elica antiparallela 


+ L’appaiamento delle basi (A con T e G con C) mantiene uniti i due 
filamenti della doppia elica 


+ La replicazione del DNA avviene mediante la separazione dei due 
filamenti e la copia di ciascuno di essi 


+ ll dogma centrale della biologia molecolare: 
0 DNA origina RNA origina proteina 


+ La trascrizione rappresenta la produzione di una copia di RNA di uno 
dei due filamenti del DNA 


+ La traduzione rappresenta la decodificazione di una molecola di 
RNA per produrre una proteina 


Ogni organismo contiene l’informazione necessaria per costruire e mantenere una 
copia vitale di se stesso. I concetti di base dell’ereditarietà e, come conseguenza, i 
geni, possono essere fatti risalire al 1865 agli studi di Gregor Mendel (analizzati da 
Orel, 1995). Mendel, dai risultati dei suoi incroci con i piselli, concluse che ogni 
pianta, pur possedendo due alleli per ogni gene, mostrava un unico fenotipo. Pro- 
babilmente l’impresa più significativa di Mendel è rappresentata dalla capacità di 
identificare correttamente un fenomeno complesso, senza la minima conoscenza 
dei processi molecolari alla base di tale fenomeno. La trasmissione ereditaria attra- 
verso spermi e cellule uovo diventava nota all’incirca nello stesso periodo e, Ernst 
Haeckel, notando che gli spermi consistevano essenzialmente di materiale nu- 
cleare, postulò che il nucleo fosse responsabile dell’ereditarietà. 


2 DNA: STRUTTURA E FUNZIONE 1 


1.1 L’acido nucleico è il materiale ereditario 


L’idea che il materiale genetico fosse fisicamente trasmesso dai genitori ai figli è 
stata accettata fin dalla formulazione del concetto di ereditarietà. Candidati plausi- 
bili per il ruolo di materiale genetico erano considerati sia le proteine che gli acidi 
nucleici. Tuttavia, fino al 1940 molti scienziati favorivano le proteine essenzial- 
mente per due ragioni: a) le proteine sono abbondanti nelle cellule (benché l’am- 
montare di una singola proteina possa variare da un tipo cellulare ad un altro, il 
contenuto medio di proteine della maggior parte delle cellule ammonta a più del 
50% del peso secco), e b) gli acidi nucleici sembravano possedere una struttura 
troppo semplice per contenere la complessa informazione che si presumeva essere 
richiesta per soddisfare le caratteristiche dell’ereditarietà. Il DNA (acido deossiri- 
bonucleico) fu isolato per la prima volta nel 1869 dal chimico svizzero Johann Fre- 
derick Miescher, mediante la separazione dei nuclei dal citoplasma. Miescher 
quindi isolò dai nuclei una sostanza acida che chiamò nucleina; la sostanza era 
ricca di fosforo e priva di zolfo, caratteristiche che la distinguevano dalle proteine. 
Dimostrando di avere un notevole intuito, Miescher suggerì che “se si assume che 
una singola sostanza sia la specifica causa della fecondazione, allora bisogna obbli- 
gatoriamente pensare alla nucleina”. 

Nel 1926, sulla base dell’idea che il DNA conteneva approssimativamente una 
eguale quantità di quattro composti chimici differenti, chiamati nucleotidi, e me- 
diante la determinazione del tipo di legame che univa i differenti nucleotidi, Le- 
vene e Simms, per spiegare l’organizzazione chimica dei nucleotidi all’interno de- 
gli acidi nucleici, proposero una struttura tetranucleotidica (Fig. 1.1). La struttura 
proposta era costituita da una semplice unità a quattro nucleotidi che si ripeteva 
molte volte a formare una lunga molecola di acido nucleico. Poiché la struttura te- 
tranucleotidica era relativamente semplice, si pensava che gli acidi nucleici difficil- 
mente avrebbero potuto contenere la variabilità chimica attesa per il materiale ge- 


OH 
HO Ha — Zucchero — Adenina 
HO — lo — Zucchero — Uracile 
HO - la — Zucchero — Guanina 


HO — PO — Zucchero — Citidina 


Figura 1.1. Il modello tetranucleotidico proposto per la struttura del DNA da Levene e Simms nel 
1926. Al tempo in cui tale modello veniva proposto si pensava che l’acido nucleico delle piante e de- 
gli animali potesse essere diverso e non erano ancora ben conosciute le differenze tra DNA e RNA. 
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netico. D’altro canto, le proteine contenenti 20 differenti aminoacidi potevano for- 
nire la base per una notevole variabilità. 

Nel 1928, Frederick Griffith ha effettuato una serie di esperimenti utilizzando 
ceppi diversi del batterio Streptococcus pneumoniae (Griffith, 1928). Alcuni dei 
ceppi utilizzati erano virulenti, a significare che erano in grado di provocare la pol- 
monite nei topi e nell’uomo. Altri ceppi non erano virulenti e non causavano alcun 
tipo di patologia. I ceppi virulenti o non virulenti sono morfologicamente distin- 
guibili in quanto i primi posseggono una capsula polisaccaridica che circonda il 
batterio. Tale caratteristica conferisce alle colonie cresciute in piastre di agar un 
aspetto liscio e lucido. Al contrario, i batteri non virulenti sono privi della capsula 
e le loro colonie si presentano ruvide. I batteri lisci sono virulenti in quanto la ca- 
psula polisaccaridica impedisce il loro attacco da parte del sistema immunitario 
dell’animale infettato. Tali batteri sono quindi in grado di riprodursi e di causare la 
polmonite. I batteri ruvidi, non presentando la protezione polisaccaridica, sono fa- 
cilmente riconosciuti e distrutti dal sistema immunitario dell’ospite. 

Griffith sapeva che solo i batteri lisci inoculati nei topi erano in grado di provo- 
care la polmonite. Se i topi venivano inoculati con batteri virulenti uccisi con il ca- 
lore non si manifestava la polmonite, in analogia all’inoculo dei batteri non viru- 
lenti vivi. L'esperimento chiave di Griffith (Fig. 1.2) comportò l’inoculo nei topi di 
batteri non virulenti (ruvidi) vivi, mescolati con batteri virulenti (lisci), uccisi con 
il calore. Come detto precedentemente, non si manifestava la morte dei topi 
quando le due popolazioni cellulari erano iniettate indipendentemente. Al contra- 
rio, l’inoculo della miscela di cellule ruvide-vive e lisce-morte provocava la morte 
dei topi. L'analisi del sangue dei topi morti rivelava la presenza di cellule vive lisce 
in grado di crescere su piastre di agar. La conclusione di Griffith fu che in qualche 
modo le cellule lisce uccise al calore erano in grado di convertire quelle ruvide 
vive non virulente in cellule lisce virulente. Griffith definì il fenomeno trasforma- 
zione e suggerì che il principio trasformante doveva essere rappresentato da 
qualche composto della capsula polisaccaridica o richiesto per la sua sintesi, ben- 
ché avesse notato che la capsula da sola non era in grado di causare la polmonite. 

Nel 1944, Osvald Avery, Colin MacLeod e Maclyn McCarty pubblicarono un 
lavoro che dimostrava che la molecola responsabile del principio trasformante era 
il DNA (Avery, MacLeod e McCarty, 1944). L'esperimento comportava la coltura 
di grandi quantità di batteri di Streptococcus pneumoniae lisci ed il loro tratta- 
mento con il calore. La miscela di cellule morte fu omogeneizzata e, dopo diverse 
estrazioni con detergente, l’estratto ottenuto, se iniettato insieme a cellule vive ru- 
vide, dimostrava di contenere ancora il principio trasformante. L'estratto dopo di- 
versi trattamenti con cloroformio ed enzimi fu purificato rispettivamente dalle pro- 
teine e dai polisaccaridi. Infine, la precipitazione con etanolo della frazione purifi- 
cata originava una massa fibrosa ancora in grado di indurre la trasformazione dei 
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Figura 1.2. Gli esperimenti di Griffith, combinati con i risultati di Avery, MacLeod e McCarty, hanno 
portato all’identificazione del DNA come principio trasformante dello Streptococcus pneumoniae. 
Griffith aveva notato che l’iniezione nei topi di batteri lisci vivi originava la polmonite ed eventual- 
mente la morte degli stessi topi. Il trattamento con il calore dei batteri prima dell'iniezione non provo- 
cava la polmonite. | ceppi di batteri non patogeni, che non causavano la manifestazione patologica, 
potevano essere trasformati in batteri patogeni mediante co-iniezione con i batteri patogeni uccisi al 
calore. Avery, MacLeod e McCarty identificarono il DNA come principio trasformante. 


batteri non virulenti ruvidi. Dalla coltura originale di 75 litri di cellule batteriche 
erano stati ottenuti circa 10-25 mg di ‘fattore attivo”. Successivi esperimenti hanno 
stabilito, oltre ogni ragionevole dubbio, che il principio trasformante era il DNA. 
La massa fibrosa fu analizzata per il rapporto azoto/fosforo, che si trovò coincidere 
con quello atteso per il DNA. Allo scopo di eliminare tutti i possibili contaminanti, 
l’estratto finale fu trattato con enzimi proteolitici, come tripsina e chimotripsina, e 
con ribonucleasi per degradare l’ RNA. Questi trattamenti, pur eliminando qualsiasi 
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attività residua di proteine e RNA, permettevano di conservare l’attività trasfor- 
mante. La conferma finale che il DNA era il principio trasformante derivò dalla di- 
gestione dell’estratto con l’enzima deossiribonucleasi, che eliminò l’attività tra- 
sformante. 

La seconda importante evidenza a sostegno del DNA come materiale genetico, 
venne fornita dagli studi di infezione del batterio Escherichia coli da parte di uno 
dei suoi virus, il batteriofago T2. Molto spesso semplicemente definito fago, il vi- 
rus è caratterizzato una proteina di rivestimento (coat) che racchiude un core di 
DNA (Fig. 1.3). Agli inizi degli anni ‘50, poco era noto riguardo alle fasi iniziali 
dell’infezione virale. Era noto che il fago, dopo essere stato assorbito dalla superfi- 
cie del batterio, entrava in una fase di latenza di circa 10 minuti, prima che si ini- 
ziasse la produzione di particelle virali infettanti, che alla fine portavano alla lisi 
della cellula e al loro rilascio. Alfred Hershey e Marta Chase pensarono che se 
avessero conosciuto il destino delle proteine e del DNA all’inizio dell’infezione, 
avrebbero potuto comprendere maggiormente gli eventi di questo meccanismo ini- 
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Figura 1.3. Il ciclo vitale del batteriofago T2. Durante l’infezione, il fago aderisce alla superficie della 
cellula di E. coli. Per la sua replicazione, il fago inserisce nel batterio solo l'informazione genetica, e 
non l’intera particella virale. La struttura proteica del fago (ghost) senza materiale genetico rimane 
adesa alla superficie cellulare. Dopo la produzione di nuove particelle fagiche, avviene la lisi del bat- 
terio e le particelle neosintetizzate sono rilasciate nel mezzo circostante. 
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Figura 1.4. L'esperimento del frullatore di Hershey e Chase dimostra che l'acido nucleico è il mate- 
riale genetico. Hershey e Chase hanno fatto replicare il batteriofago T2 su batteri coltivati in terreno 
contenente P°° (per marcare il fosforo degli acidi nucleici) o S° (per marcare lo zolfo delle proteine; i 
gruppi laterali degli aminoacidi metionina e cisteina contengono zolfo). Hanno quindi utilizzato i batte- 
riofagi radio-marcati per infettare una coltura di batteri non marcati. Dopo una breve incubazione, i 
batteri erano raccolti per centrifugazione e messi in un frullatore per separare i batteri dalle particelle 
virali adese sulla loro superficie. Essi osservarono che quando si utilizzavano fagi con il DNA marcato, 
la marcatura era trasferita all’interno della cellula batterica, mentre con le proteine marcate la radioatti- 
vità rimaneva all’esterno, associata con i ghost fagici. Gli autori dell'esperimento conclusero che il ma- 
teriale ereditario (il materiale trasferito per produrre una nuova progenie) era l'acido nucleico. 
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ziale. A tale scopo, utilizzarono i radioisotopi P°? e S?° per seguire i componenti 
molecolari del fago durante l’infezione (Fig. 1.4). Siccome il DNA contiene fo- 
sforo e non zolfo, il P3° può marcare solo l’acido nucleico, al contrario delle pro- 
teine che contenendo zolfo, ma non fosforo, verranno marcate solo da S?. Se si 
coltivano le cellule di £. coli in presenza di P3? e S35 e, quindi, le si infetta con il 
virus T2, le particelle virali neosintetizzate saranno marcate rispettivamente da SÌ° 
nel rivestimento proteico e da P?? nel core di DNA. Le particelle virali radioattive 
possono essere isolate dal mezzo di coltura e quindi utilizzate per infettare una po- 
polazione di batteri non marcati. Hershey e Chase dopo assorbimento delle parti- 
celle virali marcate sulla superficie dei batteri non marcati, separarono, mediante 
centrifugazione, le cellule dal materiale non assorbito. Le cellule furono successi- 
vamente risospese e la sospensione agitata per separare i batteri infettati dai 
“ghost” fagici. I “ghost” non devono contenere il materiale genetico che, al contra- 
rio, necessita di essere replicato all’interno del batterio ospite. Hershey e Chase 
trovarono che circa 180% dello S*° era rimosso dai batteri, mentre questo procedi- 
mento rimuoveva solo circa il 20% del P*?. Essi conclusero che “la maggior parte 
del DNA fagico entra nelle cellule, mentre un residuo contenente circa 1'80% delle 
proteine solforate del fago rimane sulla superficie cellulare”. Questo lavoro, insieme 
a quello di Avery, MacLeod e McCarty, forniva una forte evidenza che il DNA era 
la molecola responsabile dell’ereditarietà. Tuttavia, in modo curioso, Hershey e 
Chase dimostrarono qualche scetticismo rispetto alle loro scoperte, concludendo il 
loro lavoro con la seguente frase: “Le proteine non hanno funzione nella moltipli- 
cazione fagica, mentre il DNA ha qualche funzione” (Hershey e Chase, 1952). 


1.2 Struttura degli acidi nucleici 


Come visto nella sezione precedente, il DNA, o più correttamente gli acidi nu- 
cleici, costituiscono il materiale ereditario. In effetti, il DNA è il materiale eredita- 
rio nella maggior parte degli organismi, anche se un certo numero di virus utilizza 
lPRNA (acido ribonucleico) come materiale per il loro genoma. Il DNA e PVRNA 
sono molecole polimeriche costituite da sequenze lineari di subunità chiamate nu- 
cleotidi. Ogni nucleotide è costituito da tre parti: una base azotata, uno zucchero a 
cinque atomi di carbonio ed un gruppo fosfato (Fig. 1.5). L'unione della base con 
lo zucchero è definita nucleoside, mentre base-zucchero-fosforo costituiscono il 
nucleotide. I nucleotidi del DNA, contenendo lo zucchero 2’-deossiribosio, si defi- 
niscono deossiribonucleotidi, mentre quelli dell'RNA, contenendo lo zucchero ri- 
bosio, sono noti come ribonucleotidi. Le basi azotate dei nucleotidi possono essere 
purine, a doppio anello, o pirimidine, a singolo anello; sia DNA che RNA sono 
costituiti da nucleotidi contenenti due tipi di purine e due tipi di pirimidine. Le pu- 
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Figura 1.5. La struttura delle purine e delle pirimidine presenti negli acidi nucleici. Le basi azotate 
sono evidenziate in arancio e gli zuccheri in blu. Nella parte inferiore della figura sono riportati i si- 
stemi di numerazione utilizzati nel libro. Gli atomi dell’anello purinico sono numerati da 1 a 9 e quelli 
dell'anello pirimidinico da 1 a 6. Gli atomi dello zucchero sono numerati da 1’ a 5°. 
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rine per DNA e RNA sono le stesse: adenina (A) e guanina (G). La pirimidina ci- 
tosina (C) è presente in entrambi gli acidi nucleici, mentre la pirimidina timina è 
limitata al DNA e l’uracile all’RNA. 

Il sistema di numerazione dei nucleotidi utilizzato in tutto il testo è mostrato in 
Fig. 1.5. Ciascun atomo di carbonio e di azoto degli anelli pirimidinici e purinici è 
numerato rispettivamente da 1 a 6 e da 1 a 9. Gli atomi di carbonio dell’anello sac- 
caridico (ribosio o deossiribosio) sono numerati da 1’ a 5’ (si leggono 1-primo e 5- 
primo). Quindi, il 2°-deossiribosio non contiene il gruppo ossidrile attaccato al car- 
bonio 2’ dell’anello dello zucchero. I singoli nucleotidi del DNA e dell'RNA sono 
uniti l’uno all’altro mediante legami zucchero-fosfato, in cui l’ossidrile del carbo- 
nio 3’ di un nucleotide si lega al gruppo fosfato presente sul carbonio 5° di un altro 
nucleotide (Fig. 1.6). Due nucleotidi legati formano un dinucleotide, tre, un trinu- 
cleotide e numerosi nucleotidi, connessi in sequenza, sono definiti polinucleotidi. 


Agli inizi degli anni ’50, il chimico Erwin Chargaff effettuò degli esperimenti per 
cercare di definire la composizione chimica degli acidi nucleici, scoprendo che questi 
polimeri non contenevano una eguale proporzione di ogni nucleotide. Chargaff isolò 
il DNA da svariati organismi procariotici ed eucariotici (Chargaff, Lipshitz e Green, 
1952: Chargaff et al., 1951; Zamenhof, Brawerman e Chargaff, 1952), lo idrolizzò 
con un acido forte e separò i nucleotidi mediante cromatografia su carta. I suoi 
esperimenti dimostrarono che il rapporto relativo delle quattro basi non era uguale, 
ma neppure casuale. In tutti i campioni di DNA analizzati, il numero dei residui di 
adenina (A) era uguale a quello di timina (T), mentre il numero delle guanine (G) 
uguagliava quello delle citosine (C) (Tabella 1.1). Le regole di Chargaff defini- 
scono che per ogni specie: 


*A=TeC=G 
* somma delle purine = somma delle pirimidine 


e la percentuale di (G + C) non è necessariamente uguale alla percentuale di 
(A+T). 


Queste scoperte aprirono la possibilità che la specificità genetica del DNA fosse 
correlata alla precisa organizzazione dei nucleotidi all’interno della struttura. Tutta- 
via, il significato fondamentale di A = T e G = C non fu completamente compreso 
fino alla definizione della struttura tridimensionale della molecola. Nel DNA, come 
si vedrà più avanti, A si appaia sempre con T e G con C. 

Tra il 1940 e il 1953, molti scienziati erano interessati alla definizione della 
struttura del DNA e nel contempo la diffrazione dei raggi X si affermava come me- 
todo per determinare la struttura delle proteine. Questo metodo consiste nel colpire 
fibre o cristalli ordinati di una molecola con un fascio di Raggi X. Quando i raggi 
colpiscono un atomo della struttura vengono diffratti e rivelati come punto su una 
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Figura 1.6. Il legame tra nucleotidi. Il legame tra un nucleotide che contiene adenina ed uno con 
guanina. | fosfati legati allo zucchero del nucleotide con la guanina sono identificati come @, Be y. 
Nella formazione di un dinucleotide, il pirofosfato (costituito dai fosfati B e y ) viene eliminato e il 
legame fosfodiesterico unisce l’ossidrile 3° con il fosfato presente sul carbonio 5’ dello zucchero. Le 
molecole di DNA presentano sempre un 5’ fosfato e un 3° ossidrile liberi. 


lastra impressionabile. L'analisi del quadro di diffrazione fornì informazioni ri- 
guardo la struttura e la forma delle molecole nei fasci di fibre. Già nel 1938 Wil- 
liam Astbury applicò la tecnica alle fibre di DNA e nel 1947 fu in grado di mettere 
in evidenza una periodicità di 0,34 nm (unità di ripetizione) all’interno della mole- 
cola. Tra il 1950 e il 1953, Rosalind Franklin, utilizzando campioni di DNA molto 
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Tabella 1.1. Le regole di Chargaff. Il rapporto tra i singoli nucleotidi è stato isolato nel DNA di 
fonti diverse. Mentre il rapporto purina:purina e pirimidina:pirimidina varia considerevol- 
mente, il rapporto purine:pirimidine è una unità costante 


Organismo AIG T/C AIT G/C Purine: 
pirimidine 

Bovino 1,29 1,43 1,04 Il dd 
Uomo 1,59 475 1 Il 1 
Pollo 1,45 1,29 1,06 0,91 0,99 
Salmone 1,43 1,43 1,02 1,02 1,02 
Riccio di mare 1,83 1,80 1,02 1,00 1,01 
Grano 1,22 1,18 Il 0,97 0,99 
Lievito 1,67 1.92 1,03 1,2 1 
Hemophilus influenzae 1.75 1,54 1,06 0,93 1,01 
Escherichia coli 1,05 0,95 1,09 0,99 1 
Serratia marcescens 0,76 0,63 1,03 0,85 0,92 
Bacillus schatz 0,68 0,58 1,07 0,9 0,96 


purificati, ottenne dati migliori di diffrazione ai Raggi X. Il suo lavoro confermava 
la periodicità precedentemente osservata e suggeriva che la struttura del DNA fosse 
una sorta di elica. Tuttavia, Franklin non propose un modello della struttura. Piut- 
tosto, utilizzando questi ed altri risultati, Linus Pauling e Robert Corey proposero 
una struttura a tripla elica con i fosfati vicino al centro dell’asse e le basi all’e- 
sterno (Pauling e Corey, 1953). 


1.3 La doppia elica 


Franklin notò che le fibre di DNA potevano fornire due distinti quadri di diffrazione, 
che dipendevano dal modo in cui i campioni erano preparati e conservati. Il primo 
quadro (definito struttura A) era ottenuto con fibre relativamente disidratate, mentre 
il secondo (struttura B) era prevalente con un vasto spettro di condizioni. Franklin 
notò che il cambiamento dalla struttura A in quella B era reversibile, in funzione del 
livello di idratazione del campione (Franklin e Gosling, 1953). Si pensa che la forma 
B del DNA rappresenti la conformazione biologica significativa. Altre forme del 
DNA (la forma destrorsa A e quella sinistrorsa Z) certamente non esistono in deter- 
minate condizioni e potrebbero svolgere ruoli importanti in certi processi cellulari. 
Per esempio, è stata recentemente descritta una famiglia di proteine che si lega speci- 
ficamente al DNA-Z (Schwartz et al., 2001). Tuttavia, in questo contesto, ci concen- 
treremo sulle caratteristiche e sulle interazione del DNA-B. 
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Nel 1953, James Watson e Francis Crick tentarono di costruire dei modelli del 
DNA e si accorsero che la struttura proposta da Corey e Pauling era sbagliata, in 
quanto certi atomi si trovavano più vicini di quanto fosse possibile. Combinando i 
dati di diffrazione ai Raggi X di Franklin con le regole di Chargaff, Watson e Crick 
proposero nel 1953 il modello, oggi famoso, della doppia elica (Watson e Crick, 
1953). Il modello, mostrato in Fig. 1.7, possiede le seguenti principali caratteristi- 
che, alcune delle quali sono state successivamente migliorate alla luce dei dati di 
diffrazione ad elevata risoluzione sui cristalli. 


(a) Due lunghe catene polinucleotidiche si avvolgono attorno ad un asse centrale, 
formando una doppia elica destrorsa; questo significa che i giri dell’elica sono 
in senso orario, guardando l’asse verso il basso. 


(b) Le due catene sono antiparallele, in quanto ognuna ha uno specifico orienta- 
mento che è l’opposto dell’altra. 


(c) Le basi azotate delle due catene sono strutture piane, che giacciono su piani 
perpendicolari all’asse. Esse sono localizzate all’interno dell'elica, impilate le 
une sulle altre e separate da 0,34 nm. 


(d) Le basi azotate dei filamenti opposti sono appaiate mediante legami a idro- 
geno. 


(e) Ogni giro completo dell’elica misura 3,4 nm. Questo significa che un completo 
giro dell’elica è costituito da circa dieci basi per ogni filamento (10,4 coppie di 
basi). 


(f) Lungo la molecola si osserva l’alternarsi di solchi maggiori e minori. 


(g) La doppia elica ha un diametro di circa 2 nm. 


L’appaiamento delle basi azotate all’interno dell’elica è la caratteristica più signifi- 
cativa del modello di Watson e Crick. Tuttavia, alcune altre caratteristiche sono im- 
portanti per comprendere la struttura. 


1.3.1 L’elica antiparallela 


La natura antiparallela delle due catene polinucleotidiche è una caratteristica chiave 
della doppia elica. Considerando le costrizioni dovute all’angolo di legame tra le 
basi e lo zucchero-fosfato, la doppia elica non potrebbe essere facilmente assem- 
blata se i due filamenti possedessero lo stesso orientamento. Una catena dell’elica 
è orientata 5° +> 3°, e l’altra in direzione opposta (3’ + 5°) (Fig. 1.8). La nomencla- 
tura 5’ e 3’ deriva dal sistema di numerazione dell’anello dello zucchero, come mo- 
strato in Fig. 1.5. Per convenzione, le sequenze di DNA sono scritte in orienta- 
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Figura 1.7. Il modello del DNA di Watson e Crick. 


mento 5° > 3”. Questo significa che un DNA a singolo filamento inizia con un 
gruppo fosfato libero legato al carbonio 5’ dello zucchero. I successivi nucleotidi 
sono aggiunti al filamento mediante legami fosfodiesterici, che uniscono il gruppo 
ossidrilico al 3° di uno zucchero con il fosfato legato al carbonio 5’ di uno zuc- 
chero adiacente. Il filamento termina con il gruppo ossidrilico libero al 3’ dell’ul- 
timo zucchero. 
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Figura 1.8. Appaiamento delle basi e complementarietà. | due filamenti dell'elica, orientati con le 
frecce in direzione 5° > 3’, sono antiparalleli. Le basi in un filamento dell'elica sono complementari a 
quelle del filamento opposto. A si appaia sempre con T e G con C. 


1.3.2 Coppie di basi e impilamento 


Le basi azotate di entrambi i filamenti sono strutture piane posizionate in modo ap- 
prossimativamente perpendicolare all’asse dell’elica. Le basi stesse sono impilate 
le une sulle altre. L'organizzazione è meglio comprensibile se si analizza il mo- 
dello generato al computer con i dati di diffrazione ai Raggi X ad elevata risolu- 
zione sui cristalli (Fig. 1.9). Si può notare che non tutte le coppie di basi si trovano 
su piani perfettamente perpendicolari all’asse e che alcune mostrano un’organizza- 
zione nota come propeller twist, in cui le coppie di purine e pirimidine non giac- 
ciono su piani paralleli, ma sono piegate le une rispetto alle altre come le lame di 
un propulsore (Dickerson, 1983). L’integrità dell’elica è garantita dall’appaiamento 
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Figura 1.9. Modello della struttura tridimensionale del DNA generato al computer. La struttura della 
doppia elica della forma B del DNA è derivata dai cristalli di DNA con diffrazione ai Raggi X ad alta 
risoluzione. Gli atomi di ossigeno sono colorati in rosso, il fosforo in arancio, il carbonio in bianco e 
l'azoto in blu. 


al suo interno di una purina (A 0 G) con una pirimidina (T o C). Se avvenissero ap- 
paiamenti purina-purina (troppo grandi) o pirimidina-pirimidina (troppo piccoli), la 
dimensione costante dell’appaiamento purina-pirimidina sarebbe alterato. Le coppie 
purina-pirimidina si dice che sono complementari l’una rispetto all’altra ed i due fila- 
menti di una molecola di DNA sono quindi tra loro complementari. Quindi, se la se- 
quenza 5°-ATGATCAGTACG-3' è presente in un filamento di DNA, l’altro filamento 
dovrà contenere la sequenza 5°-CGTACTGATCAT-3”. Le due sequenze sono tra di 
loro complementari: 


filamento uno: 5’-ATGATCAGTACG-3’ 


filamento due: 3°-TACTAGTCATGC-5’ 
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Come si vedrà nei capitoli seguenti, l’idea della complementarietà tra i due fi- 
lamenti del DNA costituisce la base di molti esperimenti di ingegneria genetica. 
L’appaiamento tra due filamenti di DNA è molto specifico. In effetti, un appaia- 
mento corretto come quello mostrato sopra è molto stabile e facilmente forma 
un'elica. Come vedremo più avanti, filamenti di DNA che non sono perfettamente 
complementari, ma che mantengono ancora un elevato grado di complementarietà, 
sono ancora in grado di interagire l’uno con l’altro. 


1.3.3 Permettere l’accesso all’informazione contenuta nella doppia 
elica senza distruggere la struttura 


Come può essere letta l’informazione contenuta in una sequenza di DNA senza il 
bisogno di srotolare la doppia elica? La monotonia strutturale del legame zuc- 
chero-fosfato sembra rappresentare una barriera praticamente invalicabile alla let- 
tura della sequenza delle basi nel DNA. Tuttavia, i solchi presenti lungo la struttura 
dell’asse della molecola forniscono un meccanismo che permette di distinguere le 
basi l’una dall’altra. Come si può vedere in Fig. 1.7, il DNA è caratterizzato lungo 
l’asse maggiore da un’alternanza di solchi maggiori e minori. Questo risulta dal 
fatto che i legami glicosidici, che legano una coppia di basi ai rispettivi anelli sac- 
caridici, non si trovano direttamente l’uno di fronte all’altro rispetto l’asse del- 
l’elica. Come risultato si ottiene che i due legami zucchero-fosfato non sono spa- 
ziati in modo uguale lungo l’asse dell’elica e i solchi che si formano tra i legami 
non sono di dimensione comparabile. Il solco maggiore è largo (circa 2,2 nm) e 
poco profondo, mentre quello minore è stretto (circa 1,2 nm) e profondo. Il fondo 
del solco maggiore è costituito maggiormente da atomi di azoto ed ossigeno che 
appartengono a posizioni specifiche di ogni coppia di basi. Al contrario, il fondo 
del solco minore è riempito da atomi di azoto e ossigeno che sono comuni alle al- 
tre purine ed alle pirimidine. Quindi il solco maggiore mostra un potenziale per le 
interazione che, rispetto al solco minore, è più dipendente dalla sequenza delle 
basi. Questa scoperta ha permesso di determinare che le proteine che legano il 
DNA in sequenza specifica interagiscano con il DNA soprattutto mediante la for- 
mazione di legami idrogeno con gruppi specifici localizzati all’interno e lungo il 
solco maggiore. Uno dei modi più comuni con cui le proteine riconoscono specifi- 
che sequenze di DNA è l’inserimento di una @-elica nel solco maggiore. L’a- 
elica, originariamente proposta da Pauling e Corey nel 1951, è un motivo struttu- 
rale secondario delle proteine in cui gli aminoacidi di un polipeptide formano 
un’elica destrorsa. Ogni aminoacido dell’elica occupa una distanza verticale di 
0,15 nm ed ogni giro dell’elica contiene 3,6 residui aminoacidici (Appendice 1). 
In una @-elica il diametro dello scheletro polipeptidico è approssimativamente di 
0,5 nm; tuttavia, i gruppi laterali degli aminoacidi protrudono al di fuori dell'asse 
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dell’elica. Questa organizzazione origina una struttura proteica in grado di adat- 
tarsi quasi esattamente nel solco maggiore della doppia elica del DNA. I gruppi la- 
terali degli aminoacidi sono in grado di formare legami idrogeno con le basi del 
DNA del solco maggiore; questo tipo di interazione DNA-proteina è mostrato nella 
Fig. 1.10. 


1.3.4 Legami idrogeno 


Il modello della doppia elica del DNA prevede che le due catene polipeptidiche 
siano tenute insieme da legami idrogeno non covalenti, piuttosto che da interazioni 
covalenti. Questa caratteristica solleva alcune importanti domande: che cosa è un 
legame idrogeno e se è sufficientemente forte da mantenere integra la doppia elica. 

Un legame idrogeno è una debole interazione elettrostatica tra un atomo di 
idrogeno legato covalentemente ed un atomo con un doppietto elettronico non 


Figura 1.10. L'interazione tra il repressore A del batteriofago 4 e il DNA. (a) Modello generato al 
computer dell'interazione tra il DNA, mostrato con lo stesso schema colorato utilizzato in Fig.1.9, ed 
il repressore A, le cui a-eliche (in verde) sono connesse da aminoacidi che non presentano struttura 
secondaria. Due molecole del repressore Z (un dimero) interagiscono con un segmento di DNA a 
doppio filamento di 17 coppie di basi (bp). (b) Le cinque a-eliche del repressore. Ogni monomero del 
repressore À presenta cinque alfa eliche, numerate da 1 a 5 ad iniziare dal terminale aminico della 
proteina. L’elica 3 è posizionata nel solco maggiore ed i suoi gruppi laterali (non mostrati) si proten- 
dono verso la superficie del solco stesso, prendendo contatto con le basi del DNA. Le eliche 2 e 3 
formano un motivo di legame al DNA “helix-turn-helix” che si ritrova in molte proteine che legano il 
DNA. L’elica 3, il dominio di riconoscimento, interagisce con il solco maggiore del DNA in modo se- 
quenza-specifico, mentre l’elica 2, l'elica di stabilizzazione, interagisce aspecificamente con lo sche- 
letro del DNA per fornire stabilità all'interazione DNA-proteina. 
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condiviso, una caratteristica degli atomi di ossigeno ed azoto legati covalentemente. 
L’atomo di idrogeno acquisisce una carica parziale positiva, mentre il doppietto non 
condiviso una carica negativa. Le cariche opposte sono responsabili dell’attrazione 
debole. 

In generale, un legame chimico è una forza di attrazione che mantiene gli 
atomi legati. La formazione spontanea di un legame tra due atomi liberi coinvolge 
il rilascio di energia interna degli atomi non legati e la sua conversione in un’altra 
forma di energia come il calore. La forza di un particolare legame rappresenta la 
quantità di energia rilasciata dopo la sua formazione. Più forte è il legame, mag- 
giore è l’energia rilasciata. La variazione energetica (AG) che accompagna la for- 
mazione del legame è utilizzata per definire la forza del legame stesso. Il valore di 
AG è calcolato secondo la seguente equazione: 


AG=-RTInK,, 


dove R è la costante universale dei gas (8.314 J K-! mol), 7 è la temperatura as- 
soluta e In Bei rappresenta il logaritmo naturale della costante di equilibrio tra le 
forme della molecola legata e non legata. I legami covalenti sono corti (0,095 nm) 
e molto forti, con un valore di AG compreso tra -100 e —-500 kJ mol”. AI contra- 
rio, i legami idrogeno sono più lunghi (0,3 nm) e meno forti, con valori di AG 
compresi tra -10 e -30 KJ mol”. 

Nella doppia elica l’adenina forma due legami idrogeno con la timina e la cito- 
sina tre legami con la guanina (Fig. 1.8). Mentre un singolo legame ad idrogeno è 
molto debole, i circa 2500 legami che si ritrovano ogni kilobasi (kb) di DNA, for- 
niscono uno straordinario livello di stabilità dell’elica. Inoltre, bisogna notare che, 
in termini termodinamici, una coppia di basi AT è meno stabile di una coppia GC. 


1.4 Reversibilità delia denaturazione dei DNA 


Il DNA a doppio filamento è una molecola molto stabile e nei campioni disidratati 
può virtualmente rimanere intatta per migliaia di anni. I frammenti di DNA sono 
stati isolati da mummie egizie vecchie di tremila anni. In questi campioni, le mole- 
cole di DNA sono frammentate, pur conservando un’intatta struttura a doppia elica. 
In pratica, queste molecole di DNA non sono lunghe, come dovrebbero, milioni di 
nucleotidi, ma si presentano come corti frammenti di 500-1000 bp (coppia di basi), 
originati dalla rottura di alcuni legami covalenti fosfodiesterici presenti inizial- 
mente nella molecola. 

La conseguenza più rilevante del fatto che la doppia elica sia stabilizzata da le- 
gami non covalenti è la possibilità che i due filamenti possano essere separati (de- 
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naturati) semplicemente con il calore. L'energia termica fornita al campione di 
DNA sarà in grado di rompere i deboli legami idrogeno che uniscono i due fila- 
menti dell’elica, ma non avrà alcun effetto sui legami covalenti che mantengono 
integri i singoli filamenti (Lin e Chargaff, 1966). La separazione dei due filamenti 
si accompagna con cambiamenti delle caratteristiche fisiche del DNA. Uno di que- 
sti cambiamenti riguarda l'assorbimento della luce UV. Il DNA, a causa della pre- 
senza di legami singoli e doppi alternati nelle basi azotate (Fig. 1.5), assorbe la 
luce ad una lunghezza d’onda di 260 nm. Ognuna delle quattro basi possiede uno 
spettro di assorbimento leggermente diverso e lo spettro di assorbimento del DNA 
è la media di questi. Una soluzione di DNA purificato è trasparente ed il suo assor- 
bimento inizia a circa 320 nm. Spostandosi all’interno della regione UV, il picco di 
assorbimento massimo si osserva a 260 nm, seguito da un abbassamento a 220-230 
nm. Dopo tale valore la soluzione di DNA non mostra alcun assorbimento e di- 
venta opaca. Una soluzione di DNA nativo a doppia elica, alla concentrazione di 
0,05 mg/ml mostra un assorbimento a 260 nm (o densità ottica, OD) di circa 1,0. 


Quando l’elica del DNA è denaturata con il calore, originando una struttura a 
singolo filamento, si osserva un aumento dell’assorbimento. La soluzione prece- 
dente, contenente DNA nativo ad una concentrazione di 0,05 mg/ml, dopo denatu- 
razione, mostrerà un assorbimento di 1,5. I risultati di assorbimento sono frequen- 
temente espressi nel seguente modo: 


1,0A di DNA a doppio filamento = 50 ug/ml 


260 nm 


1,0A di DNA a singolo filamento = 33 ug/ml 


260 nm 
L’aumento di assorbimento osservato quando un DNA a doppio filamento di- 
venta a singolo filamento, chiamato effetto ipercromico (Thomas, 1993), rivela 
l’interazione tra i dipoli elettrici nelle basi impilate della doppia elica (Fig. 1.11). 
L’impilamento delle basi nella doppia elica ha l’effetto di ridurre l'assorbimento 
delle singole basi a causa delle interazioni competitive delle basi adiacenti nella 
pila. Nella struttura a singola elica queste competizioni non si verificano e di 
conseguenza il DNA a singolo filamento assorbe maggiore luce della doppia 
elica. 

Quando si scalda un campione di DNA, i due filamenti dell’elica iniziano a se- 
pararsi con un processo definito fusione (melting). Poiché le coppie AT sono unite 
solamente da due legami idrogeno, le regioni di DNA ricche in AT si separeranno 
per prime. All’innalzarsi della temperatura, altre regioni del DNA assumeranno la 
struttura a singolo filamento, fino alla completa separazione dei due filamenti. La 
temperatura alla quale metà del DNA sarà a singolo filamento è definita tempera- 
tura di fusione (melting point o 7_). La temperatura di fusione non è uguale per 
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Figura 1.11. L'effetto del riscaldamento sulla struttura a doppio filamento di DNA. Il riscaldamento 
del DNA sopra la temperatura ambiente provoca l’iniziale rottura dei legami ad idrogeno non cova- 
lenti, che stabilizzano i due filamenti in una struttura a doppia elica. La denaturazione del DNA è ac- 
compagnata da un aumento dell’assorbimento a 260 nm. Ad elevate temperature, sopra i 90°C, i 
due filamenti saranno completamente separati. Il processo è reversibile. Se la temperatura è abbas- 
sata lentamente, i due filamenti complementari si riassociano per formare una molecola di DNA in 
cui i due filamenti sono correttamente appaiati. La temperatura di fusione (7m) identifica la tempera- 
tura a cui la metà delle molecole è separata. 


tutte le molecole di DNA e dipende dalla dimensione della molecola e dal suo con- 
tenuto di AT e GC. Normalmente, molecole corte hanno valori di 7,,, bassi, così 
come quelle con un elevato contenuto di AT. La temperatura di fusione di una mo- 
lecola di DNA lunga può essere calcolata con la formula: 


T_,= 16,9 (log [Na*]) + 0,41 (%GC) + 81,5 °C 


in cui [Na*] è la concentrazione degli ioni sodio nella soluzione e (%GC) rappre- 
senta la percentuale delle basi G e C nella doppia elica. Quindi, una molecola di 
DNA con il 40% di GC (tipica dei genomi di mammifero) in una soluzione conte- 
nente 50 mM di NaCI, mostrerà una temperatura di fusione di 76,4 °C. Come ve- 
dremo in seguito, gli esperimenti di ingegneria genetica utilizzano frequentemente 
molecole di DNA corte (lunghe 15-30 basi). La formula sopra scritta non è utiliz- 
zabile per corte regioni di complementarietà e, per determinarne il 7, si utilizza la 
seguente relazione, nota anche come regola di Wallace (Wallace er al., 1979): 


T. = 2(AT) + 4(GC) 
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La formula definisce che per la stabilizzazione di corte doppie eliche ogni coppia di 
basi AT contribuisce con 2 °C, mentre ogni GC con 4 °C. Di conseguenza, una dop- 
pia elica di 20 nucleotidi contenente in un singolo filamento 5 A, 6 T, 3 C e 6 G mo- 
strerà una temperatura di melting di circa 2(11) + 4(9) = 58 °C. L'importanza della 
temperatura di melting diventerà chiara quando si dovrà calcolare la temperatura di 
annealing (riassociazione del DNA dopo trattamento con alte temperature) per effet- 
tuare la reazione a catena della polimerasi (PCR) ed ibridazione degli acidi nucleici. 
Il riscaldamento del DNA a doppio filamento per produrre la struttura a singolo 
filamento è un processo totalmente reversibile. Partendo dalla struttura a singolo fila- 
mento si può ritornare a quella iniziale abbassando la temperatura. Questa opera- 
zione riduce l'energia termica utilizzata per la fusione, permettendo così le collisioni 
molecolari tra i due singoli filamenti che favoriscono la riassociazione. La riduzione 
abbastanza lenta della temperatura (1-2 °C/sec) permetterà la completa riformazione 
di una doppia elica esattamente uguale a quella presente prima del riscaldamento. Al 
contrario, se la temperatura è abbassata rapidamente, ad esempio portando la solu- 
zione di DNA da 94 °C direttamente in ghiaccio, non si otterrà un appaiamento cor- 
retto ed il DNA rimarrà in una struttura quasi completamente a singolo filamento. 


1.5 Struttura del DNA nella cellula 


In funzione dell’organismo, differenti tipi di acido nucleico sono utilizzati per co- 
stituire il genoma. Ad esempio, differenti virus mostrano genomi composti da 
DNA a doppio filamento o da DNA o RNA a singolo filamento. Il cromosoma 
della maggior parte degli eucarioti è costituito da molecole di DNA lineari a dop- 
pia elica, mentre gli organismi procariotici generalmente posseggono molecole di 
DNA circolari. Queste ultime non mostrano estremità 5° e 3” libere, ma un anello 
continuo di DNA a doppio filamento. Nelle cellule procariotiche si ritrovano anche 
delle molecole di DNA extracromosomale, chiamate plasmidi. Come vedremo nel 
Capitolo 3, la comprensione di come le cellule interagiscono con queste molecole 
ha rappresentato un evento chiave nel progresso della biologia molecolare e del- 
l'ingegneria genetica. Le molecole di DNA plasmidico sono normalmente circoli 
chiusi di DNA a doppio filamento. 

Quando analizziamo la struttura del DNA (come rappresentata in Fig. 1.7), è fa- 
cile avere l'impressione che la doppia elica sia un bastoncello poco flessibile. Tutta- 
via, questa idea non è vera; in effetti le immagini a microscopia elettronica del DNA 
(Fig. 1.2) indicano che la molecola è più una stringa che un bastoncello, in grado di 
attorcigliarsi attorno a se stessa per formare una serie di strutture irregolari. All’in- 
terno di una cellula eucariotica, il DNA è associato con molteplici proteine, come ad 
esempio quelle necessarie per la sua replicazione, la sua trascrizione in RNA ed il 
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Figura 1.12. Immagini al microscopio elettronico di DNA a doppio filamento. Il DNA circolare isolato 
dal virus del polioma mostra parecchi punti in cui la molecola è incrociata, ad indicare che il DNA è 
superavvolto. Riprodotto da Vinograd et al., 1965. 


suo impacchettamento. Molte di queste proteine avvolgono il DNA attorno a loro, 0 
con altre modalità lo piegano o lo comprimono. Per molecole di DNA lineare e corto 
la compressione non rappresenta un problema. Per esempio, la tensione provocata in 
una regione del DNA facendo ruotare la doppia elica può essere rilasciata facendo 
ruotare in senso opposto un’altra regione della stessa molecola. Le estremità libere di 
una molecola di DNA lineare permettono una certa libera rotazione dei due filamenti. 
Tuttavia, per molecole di DNA circolare questo può essere problematico, in quanto la 
molecola non ha estremità libere e non può semplicemente srotolarsi per bilanciare 
l’arrotolamento in un’altra parte della molecola. Quindi, l’arrotolamento provoca la 
formazione di superavvolgimenti (supercoil) nel DNA (Fig. 1.13). 

Nel 1965, Jerome Vinograd ed i suoi colleghi proposero che le molecole di 
DNA circolare chiuso potessero adottare una “forma circolare avvolta (twisted)” 
(Vinograd er al., 1965). Questa forma si otterrebbe se, prima di saldare le estremità 
libere di una molecola di DNA lineare per formare una molecola circolare chiusa, 
un’estremità fosse attorcigliata relativamente all’altra per introdurre una certa ten- 
sione nella molecola. Questo avvolgimento dell’elica di DNA su se stessa è defi- 
nito superavvolgimento (supercoiling). Il superavvolgimento può essere introdotto 
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Figura 1.13. La formazione del DNA superavvolto. È riportata una molecola di DNA circolare chiuso 
rilassata, in cui non sono presenti superavvolgimenti. Le due metà della molecola sono colorate in 
rosso e blu per aiutare la visualizzazione degli incroci della molecola. Una torsione della molecola ri- 
sulta nella formazione di un superavvolgimento positivo (+) e di uno negativo (-). Questo processo 
non cambia il numero di legame. Se, al contrario, lo scheletro del DNA viene rotto e successiva- 
mente risaldato, dopo che una regione della molecola è passata attraverso l'interruzione, il numero 
di legame risulterà ridotto di un fattore 2. La molecola è ora superavvolta negativamente. 


solamente all’interno di, o rilasciato da, una molecola di DNA circolare chiusa me- 
diante rottura di almeno uno dei legami fosfodiesterici. 

All’interno di una particolare molecola di DNA, l’entità del superavvolgimento 
può essere definita dal suo numero di legame (linking number, L,), corrispondente 
al numero dei giri della doppia elica nella molecola originale. L'introduzione di su- 
peravvolgimenti all’interno di una molecola di DNA riduce o aumenta il numero 
dei giri dell’elica fissati durante la formazione del cerchio di DNA, producendo 
cambiamenti nel numero di legami dei cerchi finali. La differenza del numero di 
legame (AL,) fornisce un'indicazione generale del livello di superavvolgimento 
nella molecola (Fig. 1.13). Per una descrizione dettagliata della topologia del DNA 
e dei problemi connessi, i lettori interessati possono fare riferimento a libri specia- 
lizzati (Bates e Maxwell, 1993). 

Il DNA circolare chiuso isolato dai procarioti mostra un superavvolgimento 
negativo, ad indicare che la molecola è parzialmente svolta rispetto alla sua forma 
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lineare. Benché gli eucarioti contengano molecole di DNA lineare, la notevole lun- 
ghezza del DNA nei cromosomi implica che alcune costrizioni posizionate in una 
regione della molecola non potranno facilmente essere eliminate trasferendo la ten- 
sione ad una delle due estremità. Un’analogia appropriata è quella di pensare come 
si potrebbe sbrogliare una canna per innaffiare il giardino. Si dovrebbe trasferire la 
tensione alla estremità terminale della canna mediante il suo srotolamento. Questo 
tipo di attività è relativamente semplice se si ha a che fare con molecole di DNA 
corte. Tuttavia, lunghe molecole di DNA presentano una serie di problemi che ren- 
dono impraticabile il rilascio del vincolo. La semplice lunghezza del DNA renderà 
difficile spostare la torsione dall’interno della molecola alle estremità, ed inoltre 
l’associazione del DNA con le proteine creerà una barriera a questo movimento. 
Ritornando all’analogia della canna per innaffiare, un altro modo per rimuovere i 
nodi (benché poco attuabile in un giardino) potrebbe essere quello di tagliare il 
tubo per creare nuove estremità in vicinanza dell’attorcigliamento. Il tubo potrebbe 
essere srotolato localmente e quindi risaldato. È in questo modo che le cellule af- 
frontano il problema; esse possiedono degli enzimi chiamati DNA topoisomerasi, 
che tagliano un singolo o un doppio legame fosfodiesterico, per permettere arroto- 
lamenti o srotolamenti locali delle molecole di DNA. Quindi gli stessi enzimi risal- 
dano la rottura per riformare una molecola di DNA integra. 


1.6 II nucleosoma eucariotico 


Ogni cellula del nostro organismo contiene una notevole quantità di DNA. I diffe- 
renti cromosomi che costituiscono il genoma umano contengono approssimativa- 
mente 3,2 x 10° coppie di basi di DNA. Poiché l’uomo è un organismo diploide, 
con una coppia di ogni cromosoma, la quantità totale di DNA nella maggior parte 
delle cellule è di 6,4 x 10° coppie di basi. Considerando lo spazio occupato da una 
coppia di basi (0,33 nm) (Fig. 1.7), la lunghezza totale del DNA umano è approssi- 
mativamente di 2,1 metri. Come questa lunghezza può essere contenuta in un nu- 
cleo con un diametro medio di 5-10 um? Questo è possibile perché il DNA è enor- 
memente compattato, tramite l’associazione con una serie di proteine che provo- 
cano il suo avvolgimento in strutture chiamate nucleosomi. Durante l’interfase, il 
materiale genetico (con le sue proteine associate) nello stato di cromatina è relati- 
vamente srotolato e disperso all’interno del nucleo. All’inizio della mitosi la cro- 
matina si condensa notevolmente, e durante la profase è compattata a formare 
strutture riconoscibili: i cromosomi. Questo stato rappresenta una condensazione 
della lunghezza del DNA di circa 10.000 volte. 

Il materiale genetico isolato da batteri e virus è costituito da molecole di DNA 
o RNA quasi prive di proteine. Al contrario, negli eucarioti una quantità notevole 
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di proteine è complessata al DNA per formare la cromatina. Le analisi con la mi- 
croscopia elettronica hanno rivelato che le fibre di cromatina sono costituite da or- 
ganizzazioni lineari di particelle sferiche. Lungo l’asse della cromatina queste par- 
ticelle si distribuiscono regolarmente e generano un’organizzazione che assomiglia 
ad una collana di perle. Le particelle, inizialmente definite come corpi-v (Olins e 
Olins, 1974), sono ora chiamate nucleosomi. 

La digestione della cromatina con alcune nucleasi, come quella di micrococco, 
origina frammenti di DNA di circa 200 bp in lunghezza, o multipli di questo valore 
(Wingert e Von Hippel, 1968). Con una digestione incompleta della cromatina si 
produce un’ampia gamma dimensionale di frammenti, a dimostrare che la struttura 
è costituita da unità ripetute protette dal taglio enzimatico. Il DNA posizionato tra 
le unità è invece tagliato dalla nucleasi, e quindi si osservano dei multipli quando 
due o più unità rimangono unite. 

Nella cromatina, le proteine associate al DNA si dividono in proteine basiche, 
gli istoni, e meno basiche, i non-istoni. Tra le proteine associate al DNA, gli istoni 
svolgono un ruolo essenzialmente strutturale. Gli istoni contengono una notevole 
concentrazione di aminoacidi basici lisina e arginina (Appendice 1), che permet- 
tono l’interazione elettrostatica di queste proteine con il gruppo fosfato carico ne- 
gativamente dei nucleotidi. Esistono cinque tipi differenti di proteine istoniche: H1, 
H2A, H2B, H3 e H4. La regione centrale (core) di un nucleosoma è costituita da 
due copie degli istoni H2A, H2B, H3 e H4. Attorno all’ottamero istonico, si avvol- 
gono con modalità di superelica destrorsa circa 150 bp di DNA. Per ogni nucleo- 
soma, la superelica effettua 1,7 giri (Fig. 1.14). Un maggiore dettaglio della strut- 
tura del nucleosoma si è ottenuto nel 1997, quando Richmond e colleghi furono in 
grado di definire ad alta risoluzione la struttura dei cristalli del complesso DNA- 
istoni (Luger er al., 1997). 

A questo livello di risoluzione, si distinguono molti atomi di ciascun istone e si 
può definire il percorso preciso dell’elica di DNA che avvolge l’ottamero (Fig. 1.15). 
La struttura ad elevata risoluzione ha anche permesso di definire che le estremità 
amminiche di alcuni istoni protrudono dall’ottamero, proiettandosi al di fuori dal 
nucleosoma. Il significato di questa struttura risiede nel fatto che le regioni amino- 
terminali sono in grado di interagire con i nucleosomi adiacenti, creando così dei 
contatti nucleosoma-nucleosoma. Il significato della coda amminica degli istoni 
sarà ulteriormente preso in considerazione quando si analizzerà la regolazione del- 
l’espressione genica. 

La definizione dettagliata della struttura dei nucleosomi ha fornito le basi per 
predire come si formano le fibre di cromatina all’interno del nucleo, e come queste 
si condensano per formare il cromosoma mitotico. Tale modello è presentato in 
Fig. 1.16. Inizialmente, la doppia elica del DNA di 2 nm si condensa formando una 
particella core del nucleosoma, del diametro di circa 10 nm. Circa 200 bp di DNA 
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Figura 1.14. Avvolgimento del DNA attorno al core del nucleosoma. Il nucleosoma è costituito da 
due molecole di ognuno degli istoni H4, H3, H2A e H2B. Nella figura, gli istoni H2A e H2B sono rap- 
presentati solo come monomeri, in quanto gli altri due monomeri sono localizzati nella parte opposta 
dell’ottamero. Circa 150 bp di DNA si avvolgono attorno al core ottamerico, formando circa due giri. 


partecipano alla formazione di ogni singola struttura (core più linker) che costituisce 
la collana di perle visualizzata nelle immagini di microscopia elettronica. L'istone 
HI non è parte del core ottamerico e si pensa sia localizzato dove il DNA entra e 
esce dal nucleosoma, con possibile funzione di blocco della struttura stessa. 

La formazione del nucleosoma rappresenta la prima struttura dell’impacchetta- 
mento, con cui il DNA riduce di circa un terzo la sua lunghezza originale. Tuttavia, 
nel nucleo la cromatina non è presente con questa struttura estesa. In effetti, la fi- 
bra di cromatina di 10 nm è ulteriormente condensata in una fibra di 30 nm, origi- 
nalmente identificata come solenoide. Non è chiaro se la transizione della fibra di 
10 nm in quella di 30 nm rappresenti un evento fisiologico, piuttosto che un evento 
che avviene in vitro come conseguenza del cambiamento della concentrazione sa- 
lina. La fibra di 30 nm deve, tuttavia, essere costituita da numerosi nucleosomi 
strettamente impaccati, anche se il loro preciso orientamento e i dettagli della strut- 
tura non sono chiari. È stato recentemente suggerito che la fibra di 30 nm possa 
adottare una struttura compatta a zig-zag, costituita da circa quattro nucleosomi 
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Figura 1.15. La struttura del complesso DNA-nucleosoma derivata dalla cristallografia dai raggi X 
ad alta risoluzione. In entrambe le proiezioni (dall’alto e laterale) del complesso, i filamenti del DNA 
(mostrati in verde e arancio) si avvolgono attorno all’ottamero di istoni. Il core proteico è quasi intera- 
mente interno, con l'eccezione dei terminali amminici degli istoni che protrudono al di fuori del com- 
plesso. La figura è stata gentilmente fornita da Tim Richmond (ETH Zurigo) ed è riprodotta con 
l'autorizzazione di Nature (Luger et al., 1997). 


ogni 10 nm (Beard e Schlick, 2001). La formazione della fibra di 30 nm crea un 
secondo livello di condensazione, con il quale la lunghezza del DNA si riduce di 
un ulteriore fattore due. 

La transizione a cromosoma mitotico necessita di un ulteriore livello di con- 
densazione, che si ottiene con la formazione da parte della fibra di 30 nm di do- 
mini ad ansa. Le fibre sono ulteriormente condensate a formare i bracci cromoso- 
mici che costituiscono un cromatidio, struttura caratteristica dei cromosomi meta- 
fasici. 

Durante la transizione tra l’elica di DNA di 2 nm e lo stato molto condensato 
di un cromosoma mitotico è necessario ottenere un livello di condensazione di 
circa 500 volte. Il modello presentato in Fig. 1.16 giustifica solamente un livello di 
condensazione di 50:1; la successiva condensazione deriva dalla spiralizzazione e 
ripiegatura della fibra di 30 nm. L'elevata condensazione del DNA nei cromosomi 
rappresenta una seria sfida sia per la replicazione sia per la trascrizione del DNA. 
Prenderemo in considerazione questi aspetti nei paragrafi successivi. 
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Figura 1.16. Impacchettamento del DNA nel cromosoma eucariotico. Il DNA a doppio filamento con 
un diametro di 2 nm è organizzato in nucleosomi come mostrato in Fig. 1.15. Quindi l’istone H1 entra 
nel complesso, probabilmente a livello dei punti di ingresso e di uscita del DNA nel nucleosoma. | nu- 
cleosomi formano strutture lineari di 10 nm, che possono ulteriormente condensare per formare 
fibre di 30 nm. Queste potrebbero formare un'organizzazione a zig-zag. La fibra di 30 nm è quindi 
avvolta su una intelaiatura proteica che, a sua volta, si può ulteriormente ripiegare e spiralizzare per 
formare il cromosoma mitotico, che è mostrato in una fotografia con la microscopia elettronica. 


1.7 La replicazione del DNA 


Watson e Crick terminarono la loro famosa pubblicazione del 1953 con la frase: 
“non è sfuggito alla nostra attenzione che lo specifico appaiamento proposto sug- 
gerisce immediatamente un possibile meccanismo di copiatura per il materiale ge- 
netico”. Era evidente che l’organizzazione e la natura delle basi di ogni filamento 
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della doppia elica potevano servire come stampo per la sintesi di un filamento 
complementare (Fig. 1.17). Essi proposero che se la doppia elica fosse stata sroto- 
lata, ogni nucleotide dei filamenti parentali avrebbe posseduto l'affinità per il suo 
nucleotide complementare (Watson e Crick, 1953b). Quindi, ogni filamento paren- 
tale può funzionare da stampo per la sintesi di un nuovo filamento che risulta nella 
produzione di due doppie eliche di DNA identiche. Utilizzando questo modello, 
ogni nuova doppia elica risulta costituita da un filamento parentale e da un fila- 
mento neosintetizzato: un modello definito di replicazione semi-conservativa. 
Furono anche considerati due altri modelli che si basavano sempre sull’utilizzo 
dei filamenti parentali come stampo. Nel caso della replicazione conservativa, la 
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Figura 1.17. La replicazione del DNA a doppio filamento, come proposta da Watson e Crick. La se- 
parazione dei due filamenti (in nero) della molecola parentale permette ad ogni filamento di funzio- 
nare come stampo per la sintesi di un nuovo filamento (blu). Questo processo è definito replicazione 
semiconservativa, in quanto le molecole di DNA prodotte contengono un filamento vecchio ed uno 
nuovo. 
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doppia elica parentale si apre per esporre la sequenza delle basi e permettere la 
neosintesi di due filamenti. I due filamenti neosintetizzati si uniscono a formare 
una doppia elica totalmente nuova, e quelli parentali una doppia elica totalmente 
parentale. Nel secondo modello alternativo, la replicazione dispersiva, il DNA pa- 
rentale di un filamento viene disperso in entrambi i filamenti neosintetizzati, che 
risulteranno quindi una miscela di DNA nuovo e vecchio. 

Matthew Meselson e Franklin Stahl fornirono l’evidenza sperimentale che il 
modello semi-conservativo era utilizzato dai batteri per sintetizzare nuove mole- 
cole di DNA (Meselson e Stahl, 1958). I risultati del loro famoso esperimento sono 
illustrati in Fig. 1.18. Le cellule di E. coli erano state coltivate per parecchie gene- 
razioni in un terreno che conteneva come unica fonte di azoto un isotopo pesante 
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Figura 1.18. L'esperimento di Meselson e Stahl. Le cellule batteriche sono state cresciute per molte 
generazioni in un terreno contenente un isotopo pesante dell'azoto (‘SN). Il DNA isolato da queste 
cellule è stato centrifugato in un gradiente di densità per determinare la densità delle molecole 
('5N/!SN). | batteri sono quindi stati trasferiti in terreno contenente l’isotopo normale dell’azoto (!4N). 
Dopo una generazione, il DNA isolato dai batteri, analizzato in gradiente di densità, mostrava una 
densità differente ('4N/'5N) da quella precedentemente determinata (!5N/!5N). Dopo due genera- 
zioni, si osservarono due specie di molecole di DNA: una con densità uguale al DNA estratto dopo la 
crescita dei batteri per una generazione in terreno normale ('4N/!SN) e l’altra con la densità attesa 
per i batteri cresciuti per molte generazioni in terreno contenente azoto normale (!4N/!4N). Nelle ge- 
nerazioni successive, la concentrazione della banda '4N/!14N aumentava mentre quella della banda 
intermedia diminuiva. Questi risultati sono facilmente spiegabili considerando che la replicazione del 
DNA avvenga mediante un meccanismo semiconservativo. 
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non radioattivo (!N), sotto forma di cloruro di ammonio (NH,C1). Come conse- 
guenza, le cellule batteriche cresciute in questo terreno dopo avere incorporato !°N 
nelle basi azotate possedevano un DNA più pesante di quello delle stesse cellule 
cresciute in terreno contenente azoto leggero (!*N). Le due forme di DNA (leggero 
e pesante) potevano essere distinte dopo centrifugazione in un gradiente di densità 
di cloruro di cesio. Questo metodo forniva la possibilità di valutare i livelli d’incor- 
porazione di entrambi gli isotopi nel DNA durante la sua replicazione. I batteri 
contenenti DNA pesante (fatti precedentemente replicare in '’NH,CI) vennero fatti 
replicare in terreno contenente il cloruro di ammonio normale ('*NH,C1) e il loro 
DNA estratto dopo ogni successiva generazione. Dopo un singolo ciclo di replica- 
zione del DNA (una divisione cellulare) si osservò che il DNA batterico possedeva 
una densità intermedia tra quello “pesante”, contenente solamente !N, e quello 
“leggero”, contenente solamente !*N. Questo risultato era in accordo con il mo- 
dello di replicazione semi-conservativa, ma non con quello conservativo per il 
quale si sarebbe dovuto osservare la presenza di due bande distinte. Dopo due divi- 
sioni cellulari, si osservò effettivamente la presenza di due bande con diversa den- 
sità: la prima nella posizione corrispondente a DNA ibrido !9N/!4N, e la seconda 
della stessa intensità, corrispondente alla posizione attesa per il DNA totalmente 
leggero !*N/!#N. Cicli successivi di replicazione del DNA provocarono l'aumento 
della proporzione del DNA !4N/!4N. 

Gli esperimenti descritti suggeriscono che la replicazione conservativa non si 
verifica, ma non escludono la replicazione dispersiva. Tuttavia, Meselson e Stahl 
esclusero quest’ultima modalità di replicazione analizzando i singoli filamenti del 
DNA replicato. Infatti, dopo denaturazione del DNA (Fig. 1.11) si osservò che i 
singoli filamenti possedevano una densità che corrispondeva a DNA contenente to- 
talmente !N o !#N, ma non una densità intermedia come atteso se i filamenti neo- 
sintetizzati fossero costituiti da una miscela di sequenze parentali e neosintetizzate. 
La replicazione semi-conservativa avviene anche negli eucarioti (Taylor, Woods e 
Hughes, 1957) ed ora è ampiamente accettato come il meccanismo universale di 
replicazione del DNA. 


1.8 DNA polimerasi 


Le cellule batteriche e eucariotiche posseggono diverse DNA polimerasi. E. coli 
contiene tre di tali enzimi (Tabella 1.2). Il primo ad essere isolato, chiamato DNA 
polimerasi I, è essenzialmente coinvolto nella riparazione del DNA, piuttosto che 
nella replicazione. Anche la DNA polimerasi II è coinvolta nella riparazione men- 
tre la polimerasi II è il vero enzima della replicazione (Kornberg e Baker, 1992). 
La DNA polimerasi III è un enzima costituito da svariate subunità, che funziona 


32 DNA: STRUTTURA E FUNZIONE 1 


Tabella 1.2. Caratteristiche delle DNA polimerasi I, Il e Ill di E. coli 


PolI Pol II Pol III 

Funzione primaria Riparazione Riparazione Replicazione 

e rimozione 

dei primer 
Dimensione kDa 109 120 140 
Geni strutturali polA polB dnaE, N, Q, X, Z 
Molecole per cellula 400 10-20 
Polimerizzazione 5° > 3° + - + 
Esonucleasi 3° > 5° + + + 
Esonucleasi 5° > 3° + - - 


come dimero. Molte DNA polimerasi sono state studiate a livello strutturale e bio- 
chimico, permettendo di chiarire il loro meccanismo molecolare. 


Le DNA polimerasi mostrano tre distinte tipologie di attività enzimatica: 


e Tutte le DNA polimerasi dirigono la sintesi di frammenti di DNA in direzione 
53° 

* Molte DNA polimerasi posseggono anche un’attività esonucleasica 3’ > 5°. Que- 
sta attività permette di rimuovere dei nucleotidi dall’estremità 3’ del filamento in 
neosintesi. L'attività, spesso definita di “correzione di bozze” (proof-reading acti- 
vity), è utilizzata per rimuovere dei nucleotidi sbagliati che sono stati incorporati. 


* Alcune DNA polimerasi posseggono anche un’attività esonucleasica 5° > 3°. 
Questa attività permette di rimuovere sequenze che sono già state sintetizzate 
e, come vedremo più avanti, è coinvolta nella giunzione dei frammenti discon- 
tinui di DNA sintetizzati durante la replicazione del DNA sul filamento ritar- 
dato (lagging strand). 


Le DNA polimerasi non sono in grado di iniziare de novo la sintesi del DNA, ma ne- 
cessitano assolutamente di una estremità 3’-libera su cui l’enzima può aggiungere 
nuovi nucleotidi. Come conseguenza, per iniziare la sintesi del DNA dall’origine in 
entrambe le direzioni sono necessari due inneschi (primer) complementari ad 
ognuno dei filamenti da replicare. Come detto precedentemente, la sintesi del DNA 
procede solamente in direzione 5° + 3’, quindi i nuovi nucleotidi sono aggiunti all’e- 
stremità 3’-di un polinucleotide preesistente. Questa caratteristica crea un problema: 
partendo dall’origine di replicazione, soltanto un filamento dei due che devono es- 
sere replicati è orientato in direzione corretta 5° + 3”. Questo filamento, definito fila- 
mento anticipato (leading strand), può essere copiato in modo continuo, in quanto 
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Figura 1.19. La replicazione del DNA da parte della DNA polimerasi III. | filamenti della molecola di 
DNA parentale (in nero) sono srotolati da una elicasi a livello della forcella replicativa. Il filamento an- 
ticipato e quello ritardato vengono introdotti in un dimero di DNA polimerasi III. La replicazione del 
DNA sul filamento anticipato avviene in direzione 5° > 3’ mediante l'estensione di un singolo primer 
a RNA. Molti primer sono richiesti per sintetizzare il filamento ritardato in piccoli frammenti (fram- 
menti di Okasaki), i quali saranno successivamente uniti dalla DNA ligasi. 


la replicazione del DNA può avvenire senza che la DNA polimerasi si fermi mentre 
lavora nel suo orientamento preferito. La replicazione sull’altro filamento, il fila- 
mento ritardato (lagging strand), dovrebbe avvenire in direzione 3° + 5°, orienta- 
mento non possibile. Per questo motivo, il filamento ritardato deve essere replicato 
in modo discontinuo (Fig. 1.19). Per effettuare tale sintesi è necessario sintetizzare 
una serie di corti frammenti di DNA in direzione 5° > 3’ (Okasaki et al., 1968), i 
quali saranno poi uniti per produrre un nuovo filamento continuo. 

Un enzima che considereremo nuovamente nei capitoli successivi è la DNA 
polimerasi RNA-dipendente (trascrittasi inversa). L'enzima è presente in alcuni 
virus (chiamati retrovirus) che contengono RNA come materiale genetico. Dopo 
l'infezione della cellula ospite, l’RNA virale funziona da stampo per una molecola 
di DNA complementare (cDNA). Il DNA può quindi essere incorporato nel ge- 
noma dell’ospite dove, se il DNA virale viene espresso, si produrrà il genoma re- 
trovirale a RNA. La capacità di utilizzare la trascrittasi inversa in vitro per sintetiz- 
zare DNA partendo da RNA sarà presa in considerazione nel Capitolo 5. 


1.9 II meccanismo della replicazione 


In che modo la replicazione inizia e termina? Come visto precedentemente, le mo- 
lecole di DNA all’interno delle cellule sono lunghe ed è quindi ovvia la necessità 
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di un controllo accurato della loro replicazione. Divideremo il meccanismo della 
replicazione in tre fasi: inizio, allungamento e terminazione. 


e Inizio della replicazione. Questo processo non avviene in punti casuali del ge- 
noma, ma piuttosto in punti specifici chiamati origini di replicazione. Una 
volta iniziata la sintesi del DNA, due forcelle di replicazione si estendono in 
entrambe le direzioni dall’origine per permettere la completa replicazione del 
genoma. I batteri come £. coli possiedono una singola origine di replicazione 
(oriC), mentre le cellule eucariotiche contengono origini multiple differenti ri- 
spetto a oriC. Si stima che il lievito Saccharomyces cerevisiae ne contenga 
circa 300, e il genoma umano più di 20.000. oriîC è una sequenza di DNA di 
245 bp che funziona come sito di legame per diverse proteine (essenzialmente 
DnaA, B e C). Il legame di queste proteine promuove l'apertura della doppia 
elica (melting), un processo fondamentale per permettere la lettura della se- 
quenza da parte degli enzimi di replicazione. Le origini di replicazione proca- 
riotiche ed eucariotiche probabilmente assolvono la stessa funzione generale, 
ma le origini dei batteri non possono sostituire quelle eucariotiche e vice 
versa. Una volta che l’elica è srotolata, la DNA polimerasi può accedere alla 
sequenza nucleotidica “leggendo” i legami idrogeno delle coppie di basi al 
fine di sintetizzare un filamento di DNA complementare. Tuttavia, la DNA po- 
limerasi può funzionare solamente in presenza di un gruppo ossidrilico libero 
al 3°-. Questo gruppo è fornito da un primer di RNA (complementare al DNA) 
lungo 5-15 nucleotidi. La sintesi del primer è effettuata da un tipo di RNA po- 
limerasi (chiamata primasi) che non necessita per l’inizio della sintesi di estre- 
mità 3’-libere. La replicazione del DNA procede quindi su entrambi i fila- 
menti. Altre proteine sono richieste per permettere la replicazione del DNA: il 
DNA è srotolato all’interno del complesso replicativo con l’aiuto di DNA eli- 
casi (Fig. 1.19) e le regioni a singolo filamento prodotte durante lo srotola- 
mento dell’elica sono stabilizzate dal legame di proteine specifiche (single- 
stranded DNA binding proteins, SSB). Inoltre, le topoisomerasi (DNA girasi) 
sono richieste per eliminare la tensione prodotta nell’elica come risultato del 
processo di srotolamento. 


e Allungamento. Premesso che la DNA polimerasi II può solo effettuare la re- 
plicazione in direzione 5° + 3’, come è possibile replicare simultaneamente i 
due filamenti? In Fig. 1.19 è presentato un meccanismo per la sintesi del fila- 
mento anticipato e ritardato. In questo modello la DNA polimerasi III, come 
dimero, è in grado di replicare il filamento anticipato in modo continuo. Tut- 
tavia, il filamento ritardato forma un’ansa in modo tale che su entrambi 1 fila- 
menti la polimerizzazione possa avvenire in direzione 5° > 3’. La formazione 
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dell’ansa sarà in grado di invertire l'orientamento dello stampo in relazione 
all’enzima, ma non quello della effettiva sintesi sul filamento ritardato. Dopo 
la sintesi di circa 1.000-2.000 coppie di basi, l'enzima monomerico incontra 
un frammento di Okasaki completo e rilascia lo stampo. Si forma quindi una 
nuova ansa sul filamento ritardato e il processo si ripete. L'attività esonuclea- 
sica 5° > 3’ delle DNA polimerasi aiuta la formazione completa dei fram- 
menti di Okazaki. Quindi, è richiesta l’attività della DNA ligasi per unire i 
frammenti mediante la formazione di legami fosfodiesterici e formare così 
un filamento ritardato neosintetizzato integro. Discuteremo il meccanismo 
d'azione della DNA ligasi e il suo utilizzo nell’ingegneria genetica nel 
Capitolo 2. 


Terminazione. Importante come il corretto inizio è la corretta terminazione della 
sintesi del DNA. Per i batteri come E. coli che contengono un genoma circolare, 
se la replicazione inizia bidirezionalmente da un singolo punto la terminazione 
dovrà avvenire in un punto a metà del genoma. La terminazione non è un pro- 
cesso passivo, ma avviene a livello di specifiche sequenze di DNA (chiamate se- 
quenze di terminazione) che funzionano da siti di legame per una proteina chia- 
mata Tus. Il legame di Tus alle sequenze di terminazione è molto asimmetrico, 
permettendo alla forca replicativa che si sposta in una direzione di passare, ma 
bloccando la replicazione del DNA nella direzione opposta (Kamada et al., 
1996). Poco è noto circa la terminazione della replicazione del DNA negli euca- 
rioti. 


Nelle cellule eucariotiche, la replicazione del genoma deve essere coordinata 
con il ciclo cellulare, in modo tale che quando la cellula si divide siano disponi- 
bili due copie dell’intero genoma. Il ciclo cellulare è diviso in quattro fasi, 
basate sull’osservazione al microscopio ottico delle cellule in divisione 
(Fig. 1.20). Queste osservazioni hanno permesso di definire che le cellule che 
si replicano passano attraverso la metafase, dove avviene la divisione del 
nucleo e della cellula, e la interfase, dove utilizzando un microscopio ottico si 
possono rivelare pochi cambiamenti. Le quattro fasi del ciclo cellulare sono le 
seguenti: 


Fase M (mitosi): il periodo in cui il nucleo e la cellula si dividono. 


Fase GI1 (gap 1): una fase di crescita in cui avvengono trascrizione, traduzione e 
altre attività cellulari generali. 


Fase S (sintesi): quando avviene la sintesi del DNA e si ha la replicazione del 
genoma. 
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Figura 1.20. Il ciclo cellulare delle cellule eucariotiche è suddiviso nella divisione cellulare (mitosi) e 
nel periodo tra due divisioni (interfase). Dopo la divisione, durante il primo periodo di intervallo (G1), 
si osserva la crescita cellulare. Il secondo periodo di intervallo (G2) avviene dopo la sintesi del DNA 
(S). Infine, i cromosomi duplicati si separano e avviene la divisione cellulare (M). La decisione di pro- 
cedere attraverso le particolari fasi del ciclo è controllata da proteine: cicline e chinasi ciclina-dipen- 
denti (CdK). Questi sono definiti punti di controllo. 


e Fase G2 (gap 2): il secondo intervallo. Un’altra fase di crescita che prepara la di- 
visione cellulare. 


Una cellula umana in coltura impiega circa 20 ore per effettuare un completo ciclo 
cellulare. All’interno delle 20 ore le differenti fasi durano rispettivamente: G1 oltre 
9 ore, S circa 8 ore, G2 circa 2 ore e solamente 45 minuti per la divisione cellulare 
(fase M). È chiaro che le fasi S ed M devono essere coordinate affinché il genoma 
sia stato completamente replicato una volta sola prima della divisione cellulare. I 
periodi immediatamente prima dell’ingresso in S e M sono i punti chiave di con- 
trollo del ciclo cellulare. Le proteine ciclina e chinasi ciclina-dipendente (CDK) 
agiscono nel controllare l'ingresso in ogni fase del ciclo. Le cicline rappresentano 
una famiglia diversificata di proteine che si legano e attivano alcuni membri della 
famiglia CDK. Molte cicline presentano variazioni drammatiche di concentrazione 
durante il ciclo cellulare, che aiutano a variare l’attività delle CDK, la base del 
controllo del ciclo cellulare. Esistono altri punti di controllo, essenzialmente all’in- 
terno della fase S, che assicurano per esempio la riparazione dei danni del DNA 
prima che la replicazione sia completata. Lee Hartwell, Paul Nurse e Tim Hunt 
hanno ricevuto nel 2001 il premio Nobel in Fisiologia e Medicina per le loro sco- 
perte sui regolatori chiave del ciclo cellulare. 
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1.10 Ricombinazione 


Il DNA non deve mai essere considerato una struttura statica. La molecola è effetti- 
vamente in continuo cambiamento ed uno dei meccanismi attraverso cui si ottiene 
tale variabilità è la ricombinazione, che rappresenta un riarrangiamento su larga 
scala di una molecola di DNA. Questo tipo di riarrangiamento deriva dal fatto che 
due molecole di DNA condividono ampie regioni di sequenze similari (ricombina- 
zione omologa) o regioni di omologia molto corte (ricombinazione sito-specifi- 
ca). Le cellule che contengono un assetto diploide di cromosomi hanno grandi pos- 
sibilità di trovare un partner di omologia per effettuare la ricombinazione. La ri- 
combinazione nei batteri fu dimostrata per la prima volta indipendentemente nel 
1947 da Alfred Hershey e Max Delbriick, studiando l’infezione di E. coli con bat- 
teriofagi. Se una cellula batterica era infettata contemporaneamente con due batte- 
riofagi T2 geneticamente differenti, la popolazione fagica risultante conteneva fagi 
parentali così come fagi ricombinanti (Hershey, 1947). 

La ricombinazione omologa avviene tra due molecole di DNA che essenzial- 
mente hanno la stessa sequenza. L'informazione genetica viene scambiata e mesco- 
lata tra le due versioni di DNA in modo tale che le molecole di DNA ricombinanti 
siano una miscela di quelle di partenza. Per spiegare la base molecolare di questo 
evento sono stati proposti diversi meccanismi. La chiave per comprendere i pro- 
cessi molecolari coinvolti nella ricombinazione è stata proposta per la prima volta 
nel 1964 da Robin Holliday (Holliday, 1964). Questo modello di ricombinazione 
richiede che avvenga, nello stesso punto di due molecole di DNA omologo (chia- 
mate DNA donatore e ricevente), la rottura di un legame fosfodiesterico tra due nu- 
cleotidi (nick). Quindi si osserva una reazione di scambio di filamenti, seguito 
dalla chiusura dell’interruzione per intervento della ligasi. Lo scambio tra filamenti 
di DNA donatore e ricevente porta alla formazione di una giunzione di Holliday, 
una struttura in cui i filamenti di DNA incrociati connettono le molecole di DNA ri- 
cevente e donatore. La giunzione di Holliday può andare incontro a migrazione 
(branch migration), originando maggiore ricombinazione fra i filamenti delle due 
molecole di DNA. Infine, la risoluzione delle giunzioni produce le molecole di 
DNA ricombinanti. Tuttavia, in questo contesto, ci concentreremo su un meccani- 
smo modificato proposto da Meselson e Radding (1975). Questo modello implica 
che l’inizio della ricombinazione possa essere causato da un singolo nick in uno dei 
filamenti del DNA, piuttosto che su due, come precedentemente proposto dai mec- 
canismi precedenti. Il modello di base è mostrato in Fig. 1.21(a). Il meccanismo di 
formazione della giunzione di Holliday e la sua risoluzione, insieme con alcune pro- 
teine di £. coli che è noto essere coinvolte nel processo, sono elencati di seguito. 


e Il nick è creato dalla endonucleasi RecBCD, che taglia i filamenti di DNA a li- 
vello di sequenze chiamate chi (y) (5°--GCTGGTGG-3"). 
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Figura 1.21. Ricombinazione omologa e sito-specifica. (a) Il modello della ricombinazione omologa 
di Meselson-Radding. (b) L'integrazione sito-specifica del DNA del batteriofago % nel genoma di 
E. coli. Per i dettagli vedere il testo. 
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* L'invasione del filamento è catalizzata dalla proteina RecA, insieme con una 
proteina che lega e stabilizza specificamente il singolo filamento libero (SSB). 


* L’ansa-D (D-loop) che si forma dopo l’invasione del filamento viene tagliata 
dalla endonucleasi RecBCD. 


e Avviene lo scambio dei filamenti e le estremità sono saldate dalla ligasi. 


e La formazione della giunzione di Holliday è seguita dalla sua migrazione, cata- 
lizzata dalle proteine RuvA e RuvB. 


e La risoluzione della giunzione di Holliday richiede la proteina RuvC, che taglia 
due dei filamenti del DNA. La DNA ligasi salda quindi i filamenti tagliati. 


Alla fine di questi processi, la cellula conterrà due molecole che si sono scam- 
biate il DNA. Lo stesso processo avviene negli eucarioti, utilizzando simili atti- 
vità enzimatiche. Recentemente, è stata determinata la struttura ad elevata riso- 
luzione della giunzione di Holliday stabilizzata dalla proteina RuvA (Hargeaves 
et al., 1998). 

Al contrario della ricombinazione omologa, quella sito-specifica avviene 
quando due molecole di DNA non omologhe contengono delle corte sequenze 
che agiscono come bersaglio per la ricombinazione. Questo è il caso del batte- 
riofago À che si integra nel cromosoma di £. coli originando lo stato lisogenico. 
Ci interesseremo in maggior dettaglio del ciclo vitale di À nel Capitolo 3. Que- 
sto evento di ricombinazione si effettua tra i siti (attP) del DNA del batterio- 
fago che presentano omologia di sequenza con i siti (at#B) del DNA batterico, 
anche se le altre sequenze delle due molecole di DNA sono totalmente diffe- 
renti (Fig. 1.21(b)). L'enzima che catalizza l'evento insieme ad una proteina 
dell’ospite, chiamata fattore di integrazione dell’ospite (IHF), è chiamato inte- 
grasi (Int). Quando il DNA del batteriofago deve essere exciso dal genoma di £. 
coli per iniziare la produzione di nuove particelle fagiche è richiesta l’attività di 
un’altra proteina, chiamata Xis. La ricombinazione sito-specifica richiede an- 
cora l’appaiamento delle basi delle due regioni omologhe (attP con attB), ma 
non coinvolge nessuna delle proteine del meccanismo di ricombinazione omo- 
loga. 


1.11 Geni e genomi 


L'informazione genetica contenuta nella sequenza di basi del DNA dirige la produ- 
zione di proteine ed enzimi che costituiscono le cellule. Gli acidi nucleici sono or- 
ganizzati in unità chiamate geni, e l’intera collezione dei geni costituisce il ge- 
noma. La maggior parte dei geni è utilizzata come stampo per produrre proteine. Il 


40 DNA: STRUTTURA E FUNZIONE 1 


complemento di proteine all’interno di una particolare cellula è specifico (un folli- 
colo dei capelli produrrà cheratina ed una cellula B-pancreatica insulina), ma il 
contenuto proteico di una cellula può anche cambiare drasticamente, ad esempio, 
in relazione alle sostanze nutrienti. Ciò implica che in alcuni tipi cellulari certi geni 
saranno espressi mentre altri no e che le cellule siano in grado di attivare dei geni 
in funzione di stimoli esterni. Questa caratteristica pone una serie di domande: 
come la cellula è in grado di distinguere all’interno del suo genoma una sequenza 
genica da una non genica e di attivare un particolare gene senza allo stesso tempo 
alterare l’espressione di altri geni? 


1.12 Geni all’interno di un genoma 


Cosa è un gene? Sorprendentemente non esiste una risposta universalmente accet- 
tata per questa domanda. In modo molto generico, un gene può essere definito 
come un’unità di ereditarietà costituita da acido nucleico. In genetica, un gene è 
definito come una regione specifica di un cromosoma in grado di determinare una 
particolare caratteristica. In questo contesto, useremo il termine di gene per defi- 
nire una cornice di lettura aperta (ORF, la regione del gene che sarà trascritta e tra- 
dotta in una sequenza proteica) e i suoi elementi di controllo trascrizionale (promo- 
tore e terminatore). Quindi, un gene non è solamente costituito dalla sequenza co- 
dificante, ma contiene anche informazioni necessarie per la sua espressione. Molti 
ORF che codificano per proteine mostrano lo stesso tipo di organizzazione (Fig. 
1.22): iniziano con una particolare tripletta di basi (ATG) e terminano con un se- 
gnale di stop, ancora una volta una tripletta di basi (TGA, TTA e TAG). La se- 
quenza all’interno di questi due segnali può codificare direttamente per una pro- 
teina (procarioti), o può essere suddivisa in una serie di introni ed esoni (euca- 
rioti). Prenderemo in considerazione gli esoni e gli introni più avanti, ma con la di- 
sponibilità della sequenza completa dei genomi (Capitolo 9), un gene è normal- 
mente definito come una sequenza di DNA che contiene almeno 100 codoni tra i 
segnali d’inizio e di stop. Questa sequenza da sola è tuttavia insufficiente per diri- 
gere la sintesi di una proteina. Ogni gene necessita di altre sequenze di DNA che 
funzionano da siti di legame per proteine enzimatiche come la RNA polimerasi e 
per quelle coinvolte nell’inizio e nella terminazione della trascrizione e traduzione. 
Tutte queste sequenze definiscono un gene funzionale, a volte identificato come 
“unità trascrizionale”. 

Perché il genoma contiene molti geni, perché molti geni sono essenziali per la 
cellula e perché molti geni sono espressi nel medesimo momento? Almeno parte di 
queste domande hanno ricevuto una risposta utilizzando la sequenza completa dei 
genomi (Capitolo 9). 
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Figura 1.22. L'organizzazione dei geni che codificano per proteine in procarioti ed eucarioti. Nei procarioti, i geni necessari per sintetizzare tutti gli enzimi 
di una determinata via metabolica sono spesso trascritti insieme a formare un MRNA policistronico. L'operone /ac contiene il sito di legame per la RNA 
polimerasi (promotore) ed elementi enhancer, come la proteina attivatrice cAMP-dipendente (CAP). Il legame di queste proteine attiva la trascrizione. Inol- 
tre, l'’operone può contenere siti di riconoscimento per repressori proteici, il cui legame impedisce l'attacco della RNA polimerasi e, quindi, bloccano la tra- 
scrizione. | trascritti si fermano a livello di sequenze di terminazione localizzate al 3’ dell’operone. Sotto è mostrata la sequenza della regione di controllo 
dell’operone /ac. Negli eucarioti, i geni sono regolati e trascritti singolarmente. AI 5° contengono siti di legame per attivatori e repressori. Possono anche 
contenere sequenze enhancer, richieste per una efficiente espressione, che sono spesso localizzate parecchie migliaia di basi a monte dell’estremità 5’ 
del gene. L’attivatore promuove l'assemblaggio al TATA box del complesso RNA polimerasi Il oloenzima, e la trascrizione inizia a breve distanza da questo 
sito. La terminazione avviene a livello di siti specifici all'estremità 3’. La maggior differenza tra geni eucariotici e procariotici è forse rappresentata dalla 
presenza nei primi degli introni che dividono le sequenze codificanti (esoni). Gli introni sono rimossi mediante splicing prima della traduzione del trascritto. 
È mostrata la sequenza della regione promotrice del gene della f-globina di topo. 
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* Quanti geni sono contenuti in un genoma? Il genoma di E. coli (4,6 Mb) con- 
tiene circa 4.200 geni. Nel batterio la lunghezza media dei geni è di circa 950 
bp, e la distanza media tra i geni è di 118 bp, da cui deriva che la maggioranza 
del DNA genomico batterico codifica per proteine ed RNA. Il lievito Saccharomy- 
ces cerevisiae, un eucariote unicellulare, ha un genoma più grande (13.5 Mb) e 
circa 6.000 geni. L'uomo ha un genoma circa 250 volte più grande (3.300 Mb) 
del lievito ma possiede non più di 30.000 geni, un aumento di sole 5 volte ri- 
spetto al lievito. 


e Quanti geni sono essenziali all’organismo? Per determinare se un gene è essen- 
ziale per un organismo, la sua funzione deve essere in qualche modo annullata. 
Questo obiettivo è solitamente raggiunto mediante knockout genico, con cui si 
rimuove il gene dal genoma e si può quindi determinare il suo effetto sulla vita- 
lità cellulare. Molti geni che sembrano non essere essenziali potrebbero svolgere 
ruoli specializzati in condizioni che non sono valutabili con questo tipo di espe- 
rimenti (per esempio la deprivazione dei nutrienti). Tuttavia, l'apparente bassa 
concentrazione dei geni essenziali potrebbe riflettere una degenerazione funzio- 
nale all’interno di alcuni gruppi di geni. 


* Quanti geni sono espressi nello stesso momento? I geni che sono espressi in una 
particolare cellula definiscono quella cellula. Alcuni dei geni espressi in una cel- 
lula di fegato devono essere diversi da quelli espressi in una cellula epidermica. 
L'analisi dell’espressione di tutti i geni dei genomi totalmente sequenziati, come 
il lievito, suggerisce che circa il 90% dei geni è espresso in un determinato mo- 
mento, ma che l’espressione dell’80% di questi è a livelli molto bassi (nell’or- 
dine di 0,1-2 trascritti per cellula) (Causton et al., 2001). Il livello d'espressione 
dei singoli geni può variare enormemente. Le proteine molto abbondanti sono 
codificate da geni molto espressi, mentre altre proteine presenti a livelli molto 
più bassi (ad esempio una copia per cellula) sono spesso codificate da geni che 
sono espressi ad un livello molto basso. 


L’intermedio tra il DNA e la proteina codificata è rappresentato dall’ RNA. Il processo 
di conversione delle sequenze di DNA in proteine avviene in due passaggi. Il DNA è 
prima trascritto in RNA, il quale a sua volta è tradotto nella sequenza polipeptidica 
di una proteina. Come abbiamo già visto (Fig. 1.5), ' RNA differisce dal DNA in 
quanto contiene lo zucchero ribosio al posto del deossiribosio. Inoltre, nell’RNA l’u- 
racile sostituisce la timina come base complementare dell’adenina. La trascrizione è 
simile alla replicazione del DNA con l'eccezione che uno solo dei due filamenti del 
DNA viene trascritto in mRNA. Esistono due classi distinte di RNA prodotte durante 
tale processo: I’ RNA messaggero (mRNA) e gli RNA strutturali (RNA ribosomale e 
di transfer: rRNA e tRNA). Sebbene sia la forma di gran lunga meno abbondante del- 
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RNA (nella maggior parte delle cellule costituisce una percentuale estremamente 
bassa dell'RNA totale), 1’ mRNA è il trasportatore dell’informazione genetica. 


1.13 Trascrizione 


La trascrizione è il processo con cui si produce la copia di RNA di uno dei due fi- 
lamenti della doppia elica di DNA. Il filamento antisenso del DNA dirige la sintesi 
di una molecola di RNA complementare. Di conseguenza, la molecola di RNA sin- 
tetizzata è identica in sequenza al filamento senso del DNA, con l'eccezione del ri- 
bosio e della U al posto della T. Esistono differenze fondamentali nel modo in cui i 
geni sono trascritti in procarioti ed eucarioti. In questo contesto è importante capire 
i processi coinvolti in ognuno dei due casi, in quanto benché molti degli esperi- 
menti che prenderemo in considerazione coinvolgono l’utilizzo delle cellule euca- 
riotiche, il batterio E. coli svolge ancora un ruolo fondamentale nella maggior 
parte degli esperimenti di ingegneria genetica. 

La trascrizione inizia a livello di specifiche sequenze di DNA chiamate 
promotori. Come la replicazione del DNA, la trascrizione comporta tre fasi: inizio, 
l'allungamento e terminazione. Normalmente, l’inizio della trascrizione avviene all’e- 
stremità 3’ del promotore, e la terminazione a livello di siti specifici a valle della se- 
quenza codificante del gene. A prima vista, la struttura generale di un tipico gene pro- 
cariotico sembra simile a quella di un gene eucariotico (Fig. 1.22). Tuttavia, le regioni 
di controllo dei geni eucariotici non funzionano per i geni procariotici e viceversa. 

La maggior parte dei geni procariotici che codificano per proteine sono impli- 
citamente attivi da un punto di vista trascrizionale, in quanto in assenza di altri fat- 
tori la RNA polimerasi può riconoscere il promotore e produrre RNA. Il controllo 
trascrizionale viene effettuato da proteine di repressione che si legano a sequenze 
di DNA adiacenti al sito di legame della polimerasi. Il legame al DNA da parte dei 
repressori preclude il legame della polimerasi e/o impedisce la trascrizione da parte 
di una RNA polimerasi già legata. La RNA polimerasi eucariotica (pol II) coin- 
volta nella trascrizione dei geni codificanti per proteine è incapace, da sola, di rico- 
noscere i promotori. Di conseguenza, i geni eucariotici, in assenza di altri fattori, 
sono trascrizionalmente inattivi. Nei procarioti e negli eucarioti, la trascrizione è 
un processo finemente regolato in quanto per la maggior parte dei processi cellulari 
sono essenziali livelli e tempi appropriati dell’espressione dei geni. 


1.13.1 La trascrizione nei procarioti 


Frangois Jacob e Jacques Monod furono i primi a comprendere un meccanismo tra- 
scrizionale regolato (Jacob e Monod, 1961), utilizzando il sistema del metabolismo 
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del lattosio in £. coli. Il lattosio è un disaccaride costituito da galattosio e glucosio; 
quando il batterio si trova in un ambiente che contiene lattosio come unica fonte di 
zuccheri esprime i seguenti geni strutturali: 


* -galattosidasi: enzima che idrolizza il legame tra i due zuccheri glucosio e ga- 
lattosio codificato dal gene /acZ. 


* Permeasi del lattosio: enzima trans-membrana che permette l’ingressso del latto- 
sio nella cellula dall’ambiente esterno. In assenza della proteina la membrana è 
fondamentalmente impermeabile al lattosio. È codificato dal gene /acY. 


e Tiogalattoside transacetilasi: enzima a funzione ignota, codificato dal gene /acA. 


Nel genoma di E. coli, i geni per questi enzimi sono localizzati l’uno vicino all’al- 
tro (Fig. 1.23), e la regione responsabile della loro regolazione trascrizionale è lo- 
calizzata subito al 5° di questi geni strutturali. La regione che contiene i geni e gli 
elementi di regolazione è definita operone /ac. Per metabolizzare il lattosio i geni 
strutturali devono essere trascritti e le corrispondenti proteine prodotte. Si potrebbe 
quindi immaginare una semplice regolazione genica che prevede lo spegnimento 
trascrizionale dei geni strutturali in assenza di lattosio e la loro accensione in sua 
presenza. Tuttavia esistono altri fattori che influenzano la trascrizione dei geni 
strutturali lac. Per E. coli la fonte favorita di zucchero è rappresentata dal glucosio, 
perché non deve essere idrolizzato per entrare nella via respiratoria. Quindi, in con- 
temporanea presenza di lattosio e galattosio, il batterio annulla il metabolismo del 
lattosio in favore di quello del glucosio. L’operone /ac possiede i seguenti elementi 
di sequenza del DNA: 


(a) Operatore (/acO) - sito di legame del repressore. 
(b) Promotore (/acP) - sito di legame della RNA polimerasi. 
(c) Gene per il repressore (/acl) - codifica la proteina repressore Lac. Questa pro- 


teina si lega al DNA a livello dell’operatore e blocca la trascrizione dei geni 
strutturali da parte della RNA polimerasi legata a livello del promotore. 


(d) Pi: promotore del gene /acl. 


(e) Sito di legame CAP per il complesso cAMP/CAP. 


In assenza di lattosio, la RNA polimerasi si lega al promotore, ma è impedita nella 
trascrizione dei geni strutturali dal legame del repressore Lac al sito operatore (Lee 
e Goldfarb, 1991). Poiché non si produce RNA, non si produrranno proteine. Il re- 
pressore è prodotto da un’altra RNA polimerasi legata al promotore (Pi) del gene 
lacI. Quando il lattosio è presente nella cellula, agisce come induttore dell’ope- 
rone: si lega al repressore Lac inducendo nella proteina un cambiamento confor- 
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Figura 1.23. L'attivazione dell'operone /ac di E. coli. In assenza di lattosio, il repressore /ac si lega 
all’operatore (O) e previene la trascrizione dei geni strutturali da parte della RNA polimerasi legata al 
promotore (P). Quando il lattosio entra nella cellula, si lega al repressore /ac causando un cambia- 
mento conformazionale che annulla la sua capacità di legarsi al DNA. Di conseguenza, la polimerasi 
legata al sito P_ può trascrivere i geni strutturali dell’operone (/acZ, /acA e lacY). La completa attiva- 
zione dei geni /ac si osserva solamente in assenza di glucosio, quando la proteina attivatrice del ca- 
tabolismo (CAP) si lega all’operone e agevola il legame della RNA polimerasi al sito P. 


mazionale che la dissocia dal DNA. Ora la RNA polimerasi legata al promotore è 
libera di muoversi lungo il DNA sintetizzando l’ RNA dei tre geni strutturali. La 
trascrizione dei geni strutturali e la produzione delle corrispondenti proteine per- 
mette ora il metabolismo del lattosio. 

A questo punto ci si può porre una domanda: in che modo il sistema di regola- 
zione dell’operone è inizialmente acceso? Come detto precedentemente, i geni 
strutturali, inclusa la permeasi necessaria per fare entrare il lattosio nella cellula, 
sono spenti in assenza di lattosio. Sembra quindi impossibile ottenere l’attivazione, 
in quanto la permeasi è necessaria per l’ingresso del lattosio nella cellula. Si tratta 
tuttavia di una notevole semplificazione del problema, perché ciascun gene struttu- 
rale è trascritto a livelli basali bassi (circa cinque copie per cellula) anche in as- 
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senza di lattosio. Questo significa che quando il batterio incontra una fonte di latto- 
sio è in grado di trasportarne poche molecole nella cellula permettendo l’induzione 
totale dei geni strutturali lac. L’induzione totale provoca la presenza nella cellula di 
circa 5.000 molecole per ogni prodotto proteico. 

Il controllo dell’operone /ac è ancora più complicato richiedendone la repres- 
sione in presenza di glucosio, in presenza o meno di lattosio. La repressione del- 
l’operone da parte del glucosio si effettua mediante il sito CAP. Quando il livello 
di glucosio (un catabolita) nella cellula è elevato, viene inibita la produzione di 
cAMP, che al contrario si ripristina all’abbassarsi del livello del catabolita. Il 
cAMP si lega alla proteina CAP (proteina attivatrice da catabolita) e il complesso è 
in grado di legarsi al DNA, a livello del sito CAP dell’operone /ac. Il legame del 
complesso cAMP/CAP aumentando l'affinità della RNA polimerasi per il promo- 
tore, attiva la trascrizione dei geni strutturali. Poiché il glucosio è in grado di ini- 
bire la trascrizione dell’operone /ac, questo meccanismo è definito repressione da 
catabolita. 

Come molti operoni procariotici, i tre geni strutturali dell’operone /ac sono tra- 
scritti in un singolo mRNA. Il messaggero, definito policistronico, viene tradotto du- 
rante la sua sintesi, non essendoci una separazione fisica tra DNA e citoplasma. Ogni 
ORF (open reading frame o modulo di lettura aperto) contiene il suo sito di legame per 
il ribosoma (vedere oltre) ed è quindi tradotto indipendentemente dagli altri geni lac. 

Abbiamo visto precedentemente dove il trascritto inizia, ma non dove termina. 
Una volta che l’RNA polimerasi ha iniziato la trascrizione, l’enzima si sposta 
lungo lo stampo sintetizzando l’RNA finché non incontra una sequenza termina- 
trice. In questo punto la polimerasi smette di aggiungere nucleotidi alla catena di 
RNA in allungamento, rilascia il prodotto e si dissocia dal DNA. La terminazione 
si può effettuare tramite due meccanismi: 


* Terminazione rho-dipendente. La proteina rho lega il filamento di RNA neosin- 
tetizzato e quando la polimerasi rallenta a livello di certe sequenze di DNA sem- 
bra causare la terminazione. 


e Terminazione rho-indipendente. Specifiche sequenze di terminazione nell’ RNA 
possono formare strutture a forcina che promuovono la dissociazione della poli- 
merasi. Questo tipo di terminazione è indipendente da ulteriori fattori e rappre- 
senta la più comune forma di terminazione in £. coli. 


1.13.2 Trascrizione negli eucarioti 


Il processo di attivazione dei geni negli eucarioti è molto più complesso di quello 
procariotico. Procarioti ed eucarioti mostrano parecchie differenze rispetto all’atti- 
vazione genica ed alla maturazione dell'RNA. 
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* Gli eucarioti contengono diverse RNA polimerasi. 

e L’avvolgimento del DNA nei nucleosomi rappresenta una barriera per la trascri- 
zione. 

e La separazione fisica del nucleo (dove avviene la trascrizione) dal citoplasma 
(dove avviene la traduzione) presente negli eucarioti implica l’esistenza di mec- 
canismi che nel citoplasma proteggono gli mRNA dalla degradazione prima 
della traduzione. 

e I geni eucariotici sono monocistronici; ogni gene possiede un proprio promo- 
tore da cui si sintetizza un trascritto singolo. 

e I geni degli eucarioti non sono continui ma separati in regioni codificanti e non 
codificanti. 


Considereremo ognuno di questi argomenti quando prenderemo in considerazione 
come si effettua la trascrizione di un tipico gene eucariotico ed il destino dell'RNA 
che viene prodotto. 

Gli eucarioti contengono tre distinte RNA polimerasi, ognuna responsabile della 
trascrizione di una certa classe di geni (Tabella 1.3). Ogni polimerasi è costituita da 
un grosso complesso di proteine che sono coinvolte, tra le altre cose, nella regola- 
zione dell’attività polimerizzante. L'attivazione dei geni trascritti dalla RNA polime- 
rasi II (quelli che codificano per proteine) è effettuata da proteine d’attivazione tra- 
scrizionale che si legano a sequenze di DNA all’interno del promotore (Fig. 1.24). In 
assenza degli attivatori, i geni non sono trascritti. Il ruolo dell’attivatore è stato 0g- 
getto di parecchie speculazioni. Tuttavia, queste proteine sembrano funzionare molto 
semplicemente favorendo il reclutamento di diversi complessi proteici sul promo- 
tore. Il controllo dell’espressione genica è quindi effettuato mediante gli attivatori, 
che posseggono almeno due funzioni separate. Innanzitutto, devono essere in grado 
di legarsi al DNA in modo specifico per trovare il loro gene bersaglio all’interno 
della massa del DNA genomico. Secondo, mediante un dominio d’attivazione, effet- 
tuano interazioni proteina-proteina necessarie per il reclutamento sul gene della 
RNA polimerasi e di altri complessi. Tutte e due queste funzioni possono essere mo- 
dulate allo scopo di regolare l’espressione genica in risposta a specifici segnali. 


Tabella 1.3. Caratteristiche delle RNA polimerasi eucariotiche, precedentemente identificate 
come RNA polimerasi A, Be C 


RNA polimerasi Localizzazione Prodotti 
I Nucleolo 28S, 18S e 5,8S rRNA 
Il Nucleo mRNA e alcuni snRNA 


HI Nucleo tRNA, 5S rRNA e alcuni snRNA 
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Modificazione e rimodellamento 
della cromatina 


Reclutamento della RNA 
polimerasi Il oloenzima 


Figura 1.24. | molteplici ruoli degli attivatori trascrizionali nell'induzione dell'espressione genica 
eucariotica. Il legame al DNA di una proteina attivatrice mediante il suo dominio di legame (DBD) 
può avvenire sia in una regione priva di nucleosomi, come mostrato, sia con il DNA all’interno di un 
nucleosoma. Il dominio d’attivazione (ACT) recluta a livello del gene complessi di modificazione e 
rimodellamento della cromatina. L'attivatore funziona poi da reclutatore sul gene del complesso della 
RNA polimerasi Il oloenzima, permettendo l’inizio della trascrizione. All’interno della cellula, l’oloen- 
zima può esistere come singolo complesso o può suddividersi in diversi sub-complessi. 


Un ulteriore problema per la trascrizione dei geni eucariotici è rappresentato 
dal fatto che la maggior parte del DNA è organizzato nei nucleosomi, che funzio- 
nano come barriera fisica all’assemblaggio dei complessi trascrizionali. Molti atti- 
vatori sono in grado di legare le loro sequenze bersaglio sul DNA che siano o 
meno all’interno della struttura nucleosomale (Taylor et a/., 1991), mentre altri ne- 
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cessitano della rimozione del nucleosoma. Dopo il legame al DNA, gli attivatori 
reclutano sul gene uno o più dei seguenti complessi. 


* Complessi di modificazione della cromatina. Le proteine istoniche costitui- 
scono il core del nucleosoma. Tuttavia, come mostrato in Fig. 1.15, le regioni 
amino-terminali degli istoni protrudono dal complesso. Queste code possono 
essere modificate per acetilazione, fosforilazione o metilazione di specifici 
aminoacidi (Fig. 1.25(a)), e la modificazione svolge un ruolo importante per 
la trascrizione di geni adiacenti. Benché le code non siano essenziali per l’in- 
tegrità strutturale del nucleosoma, svolgono un ruolo nella struttura di ordine 
superiore della cromatina e nella interazione con proteine cromosomali non 
istoniche. Recentemente è stata prestata molta attenzione al ruolo dell’acetila- 
zione degli istoni nel processo della trascrizione. È noto da molti anni che 
l’aumento dei livelli di acetilazione degli istoni di un gene o di una regione 
cromosomica è associato con l’attività trascrizionale, mentre la ipo-acetila- 
zione è osservata in regioni non attive trascrizionalmente (Allfrey, Falkner e 
Mirsky, 1964). Il significato di questo non fu pienamente compreso fino a 
quando non fu scoperto che gli attivatori reclutavano sul promotore dei geni i 
complessi di modificazione della cromatina (Bhaumik e Green, 2001; Lar- 
shan e Winston, 2001). L’acetilazione degli istoni è effettuata da enzimi chia- 
mati istone acetiltransferasi (HAT), mentre la reazione inversa è catalizzata 
da una istone deacetilasi (H-DAC). L’acetilazione dei residui di lisina pro- 
voca l'eliminazione dalla proteina di cariche positive (Fig. 1.25(b)). Si è spe- 
culato che negli istoni ipo-acetilati (inattivi trascrizionalmente) la coda isto- 
nica si avvolga al DNA in quanto le sue cariche positive verrebbero attratte 
dallo scheletro fosfato carico negativamente. D'altro canto, le code istoniche 
acetilate potrebbero interagire più blandamente con il DNA e quindi il com- 
plesso DNA-istoni sarebbe meno rigido e potrebbe più facilmente dissociarsi, 
favorendo la trascrizione. 


* Complessi di rimodellamento della cromatina. Questi complessi, come quello 
SWI/SNF di lievito (così chiamato basandosi sulla nomenclatura utilizzata negli 
screening genetici iniziali con cui si sono isolati i geni), utilizza l'energia deri- 
vata dall’ ATP per spostare i nucleosomi. Non è chiaro il preciso meccanismo 
d’azione, ma potrebbe funzionare come motore guidato dall’ ATP che si muove 
lungo il DNA, distruggendo le interazioni DNA-proteine (Pazin e Kadonaga, 
1997). 


e RNA polimerasi Il oloenzima. Le RNA polimerasi sono state isolate per la prima 
volta nel 1960 (Stevens, 1960; Weiss, 1960). Le diverse forme dell’enzima euca- 
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riotico sono state identificate basandosi sulla loro differenziale sensibilità 
verso la o-amanitina, un octapeptide diciclico. La RNA polimerasi I è insen- 
sibile e non inibita; la RNA polimerasi II è inibita da basse concentrazioni del 
composto, mentre la RNA polimerasi III è inibita da alte concentrazioni di 
o-amanitina. Ogni polimerasi è un grosso (circa 500 kDa) complesso multi- 
proteico, contenente 8-14 subunità diverse. Noi ci concentreremo sulla RNA 
polimerasi II (pol II), in quanto responsabile della trascrizione dei geni che 
codificano per proteine. Pol II è un complesso di 12 proteine che nel lievito 
sono codificate dai geni RPB1 a RPB12. Recentemente è stata risolta la strut- 
tura cristallina di 10 delle subunità proteiche della pol II (Cramer et al., 2000: 
Cramer, Bushnell e Kornberg, 2001) (Fig. 1.26). Questa struttura aiuta a com- 
prendere il meccanismo strutturale di produzione dell'RNA. La subunità più 
grande Rpblp contiene un dominio carbossi-terminale ripetuto molto conser- 
vato (CTD), con la sequenza consenso Tyr-Ser-Pro-Thr-Ser-Pro-Ser. Il CTD 
di lievito include 26 o 27 ripetizioni e quello umano mostra 52 ripetizioni. 
Questa sequenza può essere fosforilata, una modificazione importante per 
convertire la RNA pol II dalla forma coinvolta nel riconoscimento del promo- 
tore, alla forma responsabile della sintesi vera e propria dell’ RNA (Hampsey, 
1998). Vedremo più avanti che CTD, oltre al suo ruolo nella trascrizione, è 
anche critico negli eventi di maturazione dell’RNA come il capping, la polia- 
denilazione e lo splicing. Come detto precedentemente, la pol II è incapace di 
legare il DNA da sola, richiedendo, quindi, altre proteine, chiamate fattori ge- 
nerali della trascrizione. Esistono sei principali fattori generali della trascri- 
zione (TFIA, IIB, IID, HE, IIF e IIH) che sono fondamentali per il legame 
specifico al DNA e per la formazione di un complesso polimerasico capace di 
iniziare la trascrizione. Inoltre, la maggior parte dei fattori generali di trascri- 
zione non è una singola proteina, ma un complesso multiproteico. Per esem- 
pio TFIID è costituito da 13 polipeptidi: la proteina che lega il TATA box 
(TBP) e 12 fattori associati (TAF) (Lee e Young, 2000). Nelle cellule, pol II è 
presente come grosso complesso multiproteico, chiamato oloenzima, e com- 


Figura 1.25. Modificazione delle code istoniche. (a) Le code amino terminali delle proteine istoni- 
che possono essere modificate per fosforilazione (P), acetilazione (Ac) o metilazione (Me) a livello 
dei residui di serina (S) e lisina (K) indicati. | numeri indicano la posizione degli aminoacidi all’in- 
terno di ogni proteina. Inoltre, gli istoni H2A e H2B possono essere ubiquitinati (Ub) a livello dei 
terminali carbossilici. L'espressione dei geni contenuti all’interno o in vicinanza di nucleosomi che 
contengono tali istoni modificati può essere notevolmente alterata. Ristampato da FEMS Microbio- 
logy Review, vol 23, Perez-Martin, Chromatin and transcription in Saccharomyces cerevisiae, 
pp. 503-523 Copyright (1999), con l’autorizzazione di Elsevier. (b), (c) L’acetilazione delle code 
istoniche cambia la loro carica e produce un indebolimento del complesso istone-DNA. Questo fa- 
vorisce la trascrizione. 
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Figura 1.26. Architettura della RNA polimerasi II di lievito. (a) Modello tridimensionale per 10 subu- 
nità della RNA polimerasi determinato con la cristallografia ai raggi X. Le sfere rosse presenti nella 
grossa tasca al centro della molecola rappresentano ioni magnesio nel sito attivo. Un’organizzazione 
schematica delle subunità della proteina che organizzano la struttura (b) e della proteina comples- 
sata con il DNA (blu e verde) e l'RNA (rosso) (c). Le figure sono state gentilmente fornite da Patrick 
Cramer (Università di Monaco) e sono state ristampate con l'autorizzazione di Science (Cramer et 
al., 2000; Gnatt et al., 2001). 
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posto da: SRB (soppressore della RNA polimerasi B), proteine che interagi- 
scono con CTD, proteine Med (mediatore) e alcuni fattori generali della trascri- 
zione. È ancora sconosciuta la precisa composizione dei fattori generali pre- 
senti nell’oloenzima. Le proteine SRB e Med sembrano agire come “collanti” 
che stabilizzano l’interazione tra la pol II e i fattori generali di trascrizione e 
potrebbero anche conferire la capacità di rispondere agli attivatori trascrizionali 
(Koleske e Young, 1994; Malik e Roeder, 2000). Il complesso mediatore si 
pensa partecipi con la RNA pol II al complesso di inizio e che poi sia rilasciato 
al termine di questa fase, o precocemente durante allungamento (Svejstrup et 
al., 1997). Gli attivatori trascrizionali interagiscono con svariati componenti 
dell’oloenzima, incluso TBP, TAF, TFIIB e alcune proteine SRB e Med. Qual- 
siasi interazione avvenga nella cellula, il risultato finale è semplicemente rap- 
presentato dal reclutamento del complesso pol II su un promotore che è libero 
da nucleosomi. Una volta che la polimerasi è legata al promotore, la trascri- 
zione ha inizio. 


Le interazioni tra gli attivatori e le proteine sopra descritte originano un modello di 
attivazione genica in cui tali proteine devono legarsi al DNA per prime. Gli attiva- 
tori quindi reclutano 1 complessi di modificazione e rimodellamento della croma- 
tina per rimuovere i nucleosomi dal promotore e infine la pol II è convogliata al 
promotore e la trascrizione può iniziare. Affinché la completa trascrizione del gene 
possa avvenire, non è necessario che la regione sia totalmente libera dai nucleo- 
somi. Se il promotore è accessibile ai fattori di trascrizione e alla polimerasi, la 
presenza dei nucleosomi non inibirà l'allungamento dell’mRNA. La struttura del 
nucleosoma è tale che le cariche positive (lisina e arginina) degli istoni sono loca- 
lizzate vicine a quelle negative della doppia elica. Il procedere della polimerasi 
spiazza il DNA dai nucleosomi, formando un’ansa chiusa, mentre la tensione da- 
vanti alla polimerasi genera il superavvolgimento del DNA. Questo spiazza l’otta- 
mero istonico, che prende contatto con il DNA dietro la polimerasi. In questo 
modo il nucleosoma non necessita mai di perdere il contatto con il DNA al passag- 
gio della RNA polimerasi (Studitsky, Clark e Felgerfeld, 1995). Quindi, mentre la 
polimerasi trascrive un gene, i nucleosomi non bloccano il suo procedere. Di con- 
seguenza, l’evento importante nell’ambito della regolazione genica a livello trascri- 
zionale è di ottenere il legame e il funzionamento della RNA polimerasi sul pro- 
motore. 

Negli eucarioti, i processi molecolari coinvolti nella terminazione della tra- 
scrizione sono poco definiti. Alcuni trascritti terminano circa 1000 paia di basi 
(bp) oltre il 3’ dell'RNA maturo, e sembrano fermarsi a livello di regioni di ter- 
minazione piuttosto che di specifici siti. Il trascritto è tagliato mentre è allun- 
gato dalla polimerasi, prima ancora che l’enzima abbia terminato la trascrizione 
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Figura 1.27. La struttura di un mRNA eucariotico maturo. Dopo la trascrizione, un cappuccio di 7- 
metil guanosina è aggiunto al 5° del messaggero, e il ribosio del primo e qualche volta del secondo 
nucleotide è metilato in posizione 2°. L'estremità 3’ del trascritto è poliadenilata con l'aggiunta di 
100-200 residui di adenina. 


(Fig. 1.27). Una volta tagliato il trascritto, la funzione del complesso della RNA 
polimerasi non è terminata, essendo anche coinvolto negli eventi di maturazione 
del trascritto, come lo splicing e la poliadenilazione (MeCracken et al., 1997; 
Hirose e Manley, 1998). Effettivamente, recenti evidenze suggeriscono che gli 
enzimi e l’apparato cellulare coinvolti nella trascrizione, maturazione e tradu- 
zione dell'RNA possano essere così intimamente integrati da formare “fattori 
d’espressione genica”, che massimizzano l’efficienza e la specificità di ogni sta- 
dio del processo (Maniatis e Reed, 2002). 


1.14 Maturazione dell'RNA 


Probabilmente la differenza più ovvia tra i geni dei procarioti e quelli degli euca- 
rioti è che i geni di questi ultimi sono divisi in esoni (regioni codificanti) e introni 
(regioni non codificanti). Verso la metà degli anni ‘70, Philip Sharp e Richard 
Roberts indipendentemente ibridarono un mRNA al DNA dal quale era stato tra- 
scritto e analizzarono l’ibrido ottenuto con la microscopia elettronica. Essi scopri- 
rono che l’ibridazione dell'RNA al DNA era discontinua, in quanto si osservava 
nel DNA la formazione di anse che corrispondevano a sequenze che non erano pre- 
senti nel mRNA (Chow er al., 1977; Berget, Moore e Sharp, 1977). Walter Gilbert 
assegnò dei nomi a queste regioni: le porzioni di gene presenti nel mRNA maturo 
furono definite esoni, mentre le porzioni corrispondenti alle sequenze tra essi com- 
prese furono definite introni. Il meccanismo con cui l’RNA precursore (pre- 
mRNA) viene convertito nella forma matura finale (in altre parole il modo in cui 
gli introni sono rimossi) è stato oggetto di intense ricerche fin dalla sua scoperta. 
Prima di affrontare questo argomento, è necessario analizzare cosa succede ad una 
molecola di mRNA durante la sintesi. 
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Una volta che il gene è stato trascritto, la molecola di mRNA sintetizzata viene 
notevolmente modificata. Quasi subito dopo l’inizio della sintesi, l'estremità 5’ del 
mRNA è incappucciata (capped) con l’aggiunta di un residuo di 7-metil guanosina. 
Il cappuccio è aggiunto al 5’-mediante una condensazione 5’-5° della guanosina per 
formare una struttura costituita da 3‘-G-5'°ppp5’-N-3’p. Dopo la formazione del 
cappuccio, un gruppo metilico viene aggiunto al residuo di guanina e al primo e/o 
secondo nucleotide adiacente (Fig. 1.27). La funzione del cappuccio non è comple- 
tamente chiara. È stato suggerito che questa struttura, e le proteine che la legano, 
indirizzino il legame del ribosoma e il corretto inizio della traduzione. Oltre all’ag- 
giunta del cappuccio, il 3° del mRNA viene tagliato e poliadenilato. 

Il taglio del trascritto e la sua poliadenilazione sono guidati dal segnale di poli- 
A presente all’interno dell'RNA (Fig. 1.28). Il segnale di poli-A per i pre-mRNA 
dei vertebrati è costituito da due elementi di riconoscimento che fiancheggiano un 
sito di taglio e poliadenilazione. Normalmente, l’esamero 5°--AAUAAA-3’ abba- 
stanza conservato è localizzato 20-50 nucleotidi a monte di un elemento più varia- 
bile ricco in residui U o GU. Il taglio del trascritto neosintetizzato avviene all’in- 
terno di questi due elementi ed è accoppiato con l’aggiunta di circa 200 adenosine 
al 3’-del prodotto di taglio. Per questo processo sono richiesti due fattori proteici: il 
fattore di taglio e poliadenilazione (CPSF), che lega la sequenza AAUAAA, e il 
fattore di stimolazione del taglio (CStF), che lega l’elemento a valle ricco in GU. 
Quando il sito di poliadenilazione fuoriesce dalla polimerasi viene riconosciuto da 
una sottoclasse di fattori di taglio e poliadenilazione che sono già stati reclutati 
dal CTD della polimerasi. L’assemblaggio continua con l’aggiunta di ulteriori fat- 
tori, fino a che avviene il taglio, seguito dalla poliadenilazione costituita dall’ag- 
giunta al 3’ del trascritto di circa 200 residui di adenina. La poliadenilazione è una 
caratteristica univoca degli mRNA, ma non tutti gli mRNA sono poliadenilati (per 
esempio, quelli che codificano per gli istoni non sono poliadenilati). La poliadeni- 
lazione, effettuata da un enzima noto come poliA polimerasi (PAP), non solo con- 
ferisce stabilità al trascritto, ma è anche necessaria per il trasporto del mRNA ma- 
turo dal nucleo al citoplasma, dove avviene la traduzione. Come vedremo nei Ca- 
pitoli successivi, l'aggiunta di poliA agli mRNA ha delle conseguenze pratiche 
importanti. Uno strumento essenziale per l’ingegneria genetica è infatti rappresen- 
tato dalla possibilità di ibridare sequenze di poliT solo agli mRNA, ma non ad al- 
tri RNA. 


1.14.1 Splicing dell’RNA 


Esistono diversi meccanismi di splicing dell'RNA, ognuno dei quali è specifico per 
una differente specie di RNA. Tuttavia, in questo contesto, ci concentreremo sul 
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Figura 1.28. Taglio e poliadenilazione del mRNA. All’interno del trascritto neosintetizzato è mostrato 
il sito poli-A costituito dal segnale AAUAAA insieme alla regione U/GU a valle. A queste sequenze si 
legano: un complesso di fattori specifici per taglio e poliadenilazione (CPSF), i fattori di taglio | e Il 
(CFI e II) e il fattore di stimolazione del taglio (CStF). Quindi, al complesso si lega la poliA polimerasi 
(PAP). Avviene il taglio dell'RNA e il CPSF rimane legato al 5’ del MRNA tagliato. Il 3’ è velocemente 
degradato. PAP inizia la sintesi della coda di poliA che comporta l'aggiunta dei primi 10 residui di A. 
Infine, una proteina che lega il sito poliA (PABII) stimola la sintesi di poliA e la coda si allunga fino a 
circa 200 residui di A. 


meccanismo di splicing degli mRNA, in quanto la sua comprensione e le sue con- 
seguenze sono di notevole utilità per l'ingegneria genetica. Il mRNA incappucciato 
e poliadenilato è tagliato internamente (spliced), per rimuovere gli introni e riunire 
gli esoni a formare un’unica unità che può essere tradotta. È ovvia le necessità di 
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Figura 1.29. Lo splicing degli esoni per produrre un MRNA maturo. Lo splicing del pre-mRNA nu- 
cleare avviene attraverso due distinti passaggi. Il primo passaggio comporta un attacco nucleofilo sul 
legame fosfodiesterico del confine 5’ introne-esone da parte del gruppo 2'-OH del residuo di A pre- 
sente nel punto di ramificazione. Questo rilascia l’esone al 5’ (esone 1 in blu) e origina la struttura 
“lariat” (ad ansa). Il passaggio successivo comporta un attacco nucleofilo da parte del 3’ dell’esone 1 
sul legame fosfodiesterico al 5’ dell’introne 2, che elimina l’introne come lariat e unisce i due esoni 
(blu e rosso). 


ottenere prodotti di splicing molto precisi. Qualsiasi scivolamento nella fusione de- 
gli esoni produrrebbe conseguenze disastrose per la proteina eventualmente sinte- 
tizzata. Come sono identificati i confini introne/esone e con quale meccanismo mo- 
lecolare avviene effettivamente lo splicing? La maggior parte degli introni inizia 
con il dinucleotide 5’-GU-3” e termina con 5°--AG-3’ (Fig. 1.29). Tuttavia, all’in- 
terno dell’introne ci sono altre sequenze meno conservate che funzionano da siti di 
legame per complessi fondamentali dello splicing. Questi complessi, chiamati nel 
loro insieme spliceosoma, contengono sia RNA che proteine, e sono essenzial- 
mente localizzati nel nucleo. Le molecole di RNA presenti nello spliceosoma sono 
di piccole dimensioni (100-200 nucleotidi) e complessate con proteine a formare 
dei piccoli complessi ribonucleoproteici (snRNP, o snurp). Le molecole di RNA 
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contenute in questi complessi sono ricche in residui di uridina e di conseguenza le 
snRNP vengono identificate come U1, U2, U4, US e U6. Un modello del meccani- 
smo generale di splicing catalizzato dallo spliceosoma è rappresentato in Fig. 1.29. 
Il meccanismo che accoppia l’excisione degli introni e la giunzione degli esoni di- 
pende da due reazioni di transesterificazione, che provocano la formazione di una 
struttura “lariat” dell’introne e la fusione degli esoni. La ramificazione presente 
nella struttura lariat, associata con il residuo di adenosina interno all’introne, con- 
tiene due legami fosfodiesterici con il 2’ e il 3’ della A. Con il procedere della rea- 
zione di splicing, le snRNP svolgono un doppio ruolo: catalitico e strutturale, man- 
tenendo i due esoni in prossimità. I lettori interessati nel meccanismo di splicing 
possono consultare specifiche review sull’argomento (Sharp, 1994). 


1.14.2 Splicing alternativo 


Poiché ogni esone di un gene eucariotico codifica la porzione di una proteina, si 
può immaginare che sia possibile, alterando il modo con cui un mRNA viene sot- 
toposto a splicing, produrre differenti versioni dello stesso mRNA e in ultima ana- 
lisi differenti proteine. Lo splicing alternativo è un fenomeno molto diffuso che 
recenti stime suggeriscono riguardare almeno il 30% di tutti i geni umani (Sorek e 
Amitai, 2001). In che cosa le varianti di splicing differiscono dalle sequenze ori- 
ginali da cui derivano? Le proteine prodotte da una variante di splicing possono 
presentare un'attività fisiologica uguale, contraria o completamente diversa. Di 
conseguenza lo splicing alternativo aumenta enormemente il numero di differenti 
attività proteiche che può essere originato da un numero definito di geni all’in- 
terno del genoma. 

Probabilmente uno degli esempi più eclatanti di splicing alternativo si riscontra 
nei geni che determinano il sesso nel moscerino della frutta Drosophila melanoga- 
ster. Esistono tre geni convolti nel meccanismo di determinazione del sesso: sx/ 
(sesso letale), tra (trasformatore) e dsx (sesso doppio) (Chabot, 1996). Ognuno di 
questi geni produce un pre-mRNA che permette due possibili quadri di splicing, a 
seconda se il moscerino sia maschio o femmina. La Fig. 1.30 mostra i tre geni ed i 
loro quadri di splicing. Per i maschi, l’inclusione di due esoni (esone 3 in sx/ e 
esone 2 in tra) produce molecole di mRNA che presentano segnali di terminazione 
(stop) e risulta nella formazione di proteine inattive. La sola proteina attiva nei ma- 
schi è quella tradotta dal gene dsx, che inattiva tutti i geni femmina-specifici. La 
femmina, d’altro canto, produce degli mRNA senza esoni che contengono codoni 
di stop. Nel caso di sx/ e tra, i prodotti proteici hanno un effetto positivo nel qua- 
dro di splicing osservato, controllando la scelta degli introni nella reazione dello 
spliceosoma. 
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Figura 1.30. Splicing alternativo durante la determinazione del sesso in Drosophila. AI centro dello 
schema sono riportati i tre pre-mRNA dei geni coinvolti nella determinazione del sesso (sx/, tra e 
dsx), con il quadro di splicing per la femmina (in alto) e per il maschio (in basso). Gli mRNA prodotti 
sono rappresentati ai lati (femmina a sinistra, maschio a destra). Nella femmina, i prodotti proteici de- 
gli mRNA sx/ e tra controllano la scelta dei siti di splicing. Queste proteine non sono prodotte nel ma- 
schio a causa della inclusione di esoni che contengono codoni di stop. Tuttavia, i maschi producono 
la proteina dsx, che reprime la trascrizione degli altri geni femmina-specifici. La versione femminile 
della proteina dsx reprime la trascrizione dei geni maschio-specifici. 


1.15 Traduzione 


La traduzione è il processo con cui gli RNA strutturali, e le loro proteine associate, 
decodificano l'informazione lineare contenuta all’interno del mRNA per produrre 
filamenti lineari di aminoacidi, chiamati polipeptidi, che costituiscono le proteine. 
La sequenza nucleotidica dell'RNA è letta come serie di triplette (un codone). Ogni 
codone specifica l’inserzione di un singolo aminoacido all’interno del filamento 
peptidico in corso di sintesi. La traduzione inizia con codone di inizio, AUG, e ter- 
mina a livello di uno dei tre differenti codoni di terminazione UAA, UGA o UAG 
(vedi Appendice 1). Ogni tripletta è letta di seguito dal codone di inizio in poi 
(Fig. 1.31). Le proteine contengono 20 diversi aminoacidi, tuttavia le triplette del 
codice genetico forniscono 64 possibili differenti codoni (Appendice 1). Quindi, il 
codice genetico è degenerato e pertanto la maggior parte degli aminoacidi è codifi- 
cata da più di un codone. Per esempio, la metionina è codificata da un singolo co- 
done (AUG); mentre la leucina e l’arginina sono codificate ognuna da sei codoni. Il 
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DNA: 5'-AECCICem 


AAAGATGAAGCTACTGTCTTCTATCGAACAAGCATGCGATATTTGCTAATTTGAAGTCA...-3° 

3’- TCGGAGGAOTTTCTACTTGCATGACAGAAGATAGCTTGTTCGTACGCTATAAACGATTAAACTTCAGT...-5' 

mRNA: 5°-AGCCUCCUGAAAGAUGAAGCUACUGUCUUCUAUCGAACAAGCAUGCGAUAUUUGCUAAUUUGAAGUCA. ..-3° 
Proteina: MetLysLeuLeuSerSerIleGluGlnAlaCysAspIleCysStop 


Mutazione puntiforme: 


DNA: 5’-AGCCTCCTGAAAGATGAAGCTACTGTCTEGCTATCGAACAAGCATGCGATATTTGCTAATTTGAAGTCA...-3' 
3’-TCGGAGGACTTTCTACTTGCATGACAGACGATAGCTTGTTCGTACGCTATAAACGATTAAACTTCAGT...-5 


mRNA: 5’-AGCCUCCUGAAAGAUGAAGCUACUGUCUGCUAUCGAACAAGCAUGCGAVAUUUGCUAAUUUGUUCAGT...-3° 
Proteina: MetLysLeuLeuSerA2]=IleGluGlnAlaCysAspIleCysStop 


Inserzione: 

DNA: 5’-AGCCTCCTGAAAGATGAAGCTACTGTCTTGCTATCGAACAAGCATGCGATATTTGCTAATTTGAAGTCA...-3' 
3'- TCGGAGGACTTTCTACTTGCATGACAGAACGATAGCTTGTTCGTACGCTATAAACGATTAAACTTCAGT...-5° 

mRNA: 5’-AGCCUCCUGAAAGAUGAAGCUACUGUCUUGCUAUCGAACAAGCAUGCGAUAUUUGCUAAUUUGAAGUCA...-3° 


Proteina: MetLysLeuLeuSerC-s 


Figura 1.31. La trascrizione e la traduzione di una sequenza di DNA risulta nella produzione della 
proteina codificata. Le mutazioni all’interno della sequenza di DNA hanno effetti drammatici sulla pro- 
teina prodotta. Sono mostrati gli effetti di una mutazione puntiforme e dell'inserzione di un singolo 
nucleotide nella regione codificante del gene e i cambiamenti della sequenza della corrispondente 
proteina. 


codice genetico è quasi universale: la grande maggioranza dei geni di tutti gli orga- 
nismi obbediscono allo stesso codice. Tuttavia, alcuni geni mitocondriali deviano 
dal codice. Per esempio, i mitocondri umani e di lievito utilizzano il codone di ter- 
minazione UGA per inserire un triptofano all’interno di un polipeptide. 

Cambiamenti nella sequenza di DNA di un gene possono alterare drastica- 
mente la sequenza aminoacidica della proteina da esso codificata. Nell'esempio 
mostrato in Fig.1.31, la mutazione nella sequenza del DNA che sostituisce nel fila- 
mento senso la T con una G, provoca il cambiamento di un codone per la serina 
(UCU) in quello per la alanina (GCU). L'inserzione o la delezione di nucleotidi ha 
un effetto ancora più drammatico per la proteina codificata. Nell’esempio mo- 
strato, l’inserzione di una coppia GC altera il modulo di lettura del trascritto cosic- 
ché la proteina risultante, dal punto d’inserzione in poi, è completamente diversa 
rispetto a quella non mutata. Mutazioni come queste si identificano col termine di 
scivolamento del modulo di lettura (frame-shift). Non tutte le mutazioni a livello 
del DNA provocano un cambiamento nella proteina corrispondente. Per esempio, 
se il codone per la serina è cambiato da UCU a UCG, il nuovo codone codificherà 
ancora per la serina. Questo tipo di mutazioni sono definite silenti in quanto non 
alterano la sequenza di aminoacidi. 

Nel processo di traduzione, i tRNA funzionano da intermediari, trasportando 
uno specifico aminoacido alla tripletta che lo codifica. Enzimi chiamati aminoacil- 
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tRNA sintetasi accoppiano l’aminoacido codificato da un particolare codone con il 
tRNA che contiene il corrispondente anticodone. Di conseguenza l’appaiamento 
codone-anticodone dirige l'aggiunta del corretto aminoacido nella catena in allun- 
gamento. Le molecole di mRNA sono tradotte sui ribosomi, strutture bipartite co- 
stituite da una subunità maggiore e da una minore. Ogni subunità contiene RNA 
strutturali (rRNA) complessati con proteine coinvolte nelle diverse reazioni chimi- 
che richieste per la traduzione. Come la replicazione del DNA e la trascrizione, il 
meccanismo della traduzione può essere suddiviso in tre fasi: inizio, allungamento 
e terminazione. Nei batteri, la fase di inizio comporta l’assemblaggio del ribo- 
soma a livello della sequenza ricca in purine, detta sequenza di Shine e 
Dalgarno (5°--AGGAGGU-3°) e localizzata 4-8 basi a monte del codone di inizio 
(Shine e Dalgarno, 1975). Questa sequenza, che posiziona il ribosoma per l’inizio 
della traduzione, è complementare all’estremità 3‘-dell’RNA 16S (5°--ACCUCCU-3’) 
che è contenuto nella subunità ribosomale 30S. Negli eucarioti, l'assemblaggio 
del ribosoma avviene a livello della sequenza di Kozak (consenso ottimale 
5°-ACCAUGG-3°) che circonda il codone di inizio (sottolineato) (Kozak, 1986). 
Quindi il ribosoma si muove lungo il mRNA in direzione 5° > 3’ (Fig. 1.32). La 
traduzione inizia a livello del codone AUG e continua lungo il mRNA fino a che il 
ribosoma non si dissocia, una volta incontrato il codone di terminazione. Non esi- 
ste alcun tRNA per il codone di terminazione, è invece il legame di una proteina 
RF (fattore di rilascio) che provoca la dissociazione del ribosoma. In condizioni ot- 
timali circa 15-20 aminoacidi sono polimerizzati ogni secondo (Crowlesmith e 
Gamon, 1982). Tuttavia, la velocità reale di polimerizzazione può essere notevol- 
mente più elevata in quanto più di un ribosoma può essere legato contemporanea- 
mente al mRNA; questa struttura viene definita polisoma. Il numero di ribosomi 
legati ad un particolare mRNA influenzerà la velocità di traduzione: maggiore il 
numero di ribosomi legati, maggiore sarà il numero delle catene polipeptidiche sin- 
tetizzate. In un particolare mRNA, il livello di allungamento sarà anche influenzato 
dall’uso dei codoni in quanto le molecole di tRNA per certi codoni sono più ab- 
bondanti rispetto ad altre. 


La traduzione si è dimostrata particolarmente importante per l'ingegneria gene- 
tica perché molti antibiotici hanno come bersaglio questo meccanismo per inibire 
la crescita batterica. La traduzione è inibita dai seguenti antibiotici: 


* cloranfenicolo: inibisce la peptidil transferasi della subunità ribosomale 50S. 
* eritromicina: inibisce la traslocazione effettuata dalla subunità ribosomale 50S. 


* acido fusidico: inibisce la traslocazione prevenendo la dissociazione dal ribo- 
soma di un fattore di allungamento. 
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e puromicina: un analogo dell’aminoacil-tRNA che causa la terminazione prema- 
tura della catena polipeptidica. 


* streptomicina: causa una lettura sbagliata del mRNA e inibisce l’inizio della ca- 
tena polipeptidica. 


* tetraciclina: inibisce il legame dell’aminoacil-tRNA al sito A del ribosoma. 


Negli eucarioti, la catena proteica contiene le informazioni responsabili dei pro- 
cessi post-traduzionali e della compartimentazione cellulare. La traduzione di tutte 
le proteine inizia con un residuo di metionina all’estremità amino-terminale (codi- 
ficata dal codone AUG). In molte proteine eucariotiche e procariotiche questo resi- 
duo iniziale è rimosso da un enzima chiamato metionina aminopeptidasi, che 
produce delle proteine la cui sequenza finale inizia con l’aminoacido codificato dal 
secondo codone (Bradshaw, Briday e Walter, 1998). AI termine della sintesi, le 
proteine citosoliche sono semplicemente rilasciate dal ribosoma e si trovano già 
nella localizzazione corretta per svolgere la loro funzione. Tuttavia, molte proteine 
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Figura 1.32. (a) Struttura a trifoglio del tRNA per l’alanina di lievito che mostra la localizzazione delle 
basi insolite (verdi). La molecola di tRNA può contenere le seguenti basi insolite: pseudouridina 
(49), inosina (I), diidrouridina (D), ribotimidina (T), metilguanosina (m'G), dimetilguanosina (m3G 
e metilinosina (m'!). Le basi dell’anticodone del tRNA sono appaiate con le basi del codone nel 
MRNA. 


1.15 TRADUZIONE 63 


(b) Proteina: Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Stop 
mRNA: 5°-AGGAGGUCGAAAG AUG AAG CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3° 


| Assemblaggio del ribosoma 


GGAGGUCGAAAG AUG AAG CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA. ..-3' 
308 
i 


Aggiunta del tRNA carico 


mRNA: 5'-AGGAGGUCGAAAG, ‘AUG AAG CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3° 


| Formazione del legame peptidico 


1 5'-AGGAGGUCGAAAGLAUG AAG CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3 


, | Rilascio del tRNA scarico 


mRNA: 5°-AGGAGGUCGAAAG, ‘AUG AAG CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3' 


Traslocazione del ribosoma di un codone 


CUA CUG UCU UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3' 


fe: | Aggiunta del tRNA carico 


UCU AUC GAA CAA GCA UGC GAU AUU UGC UAA UUUGAAGUCA...-3° 


1 5'-AGGAGGUCGAAAG AUG AAG CUA CUG UCU 


Figura 1.32. (a) Traduzione nei batteri di una molecola di mRNA sui ribosomi. Il ribosoma si assem- 
bla sul MRNA a livello della sequenza di Shine e Dalgarno (in rosso), a monte del codone di inizio 
(AUG). La subunità 30S si lega direttamente a questa sequenza e quindi recluta la subunità 50S. Il ri- 
bosoma 70S è un grosso complesso di rRNA e proteine che copre circa 35 basi del MRNA. Un parti- 
colare tRNA iniziatore (fmet-tRNA) lega il codone di inizio (nel sito P) mediante la formazione di 
legami idrogeno tra il codone del MRNA e l’anticodone del tRNA. Il successivo aminoacil-tRNA (cari- 
cato con il corretto aminoacido) si lega al prossimo codone (nel sito A) prima della formazione del 
legame peptidico. La formazione di questo legame implica il trasferimento degli aminoacidi legati al 
tRNA nel sito P all’aminoacil-tRNA legato nel sito A. Quindi, il tRNA scarico lascia il complesso e il 
ribosoma si muove al codone successivo. Gli altri aminoacidi sono aggiunti con la stessa modalità. 
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eucariotiche per svolgere la loro funzione devono raggiungere un particolare com- 
partimento cellulare e le stesse proteine codificano l’informazione necessaria per 
raggiungere la loro destinazione finale. Le proteine destinate al nucleo contengono 
un segnale di localizzazione nucleare (NLS), che consiste in una corta sequenza di 
aminoacidi essenzialmente basici (ad esempio PKKKRLV), che indirizza la pro- 
teina nel nucleo (Goldfarb et a/., 1986). Le proteine destinate alla secrezione, o al- 
l'inserimento nella membrana cellulare, durante la traduzione sono trasportate al- 
l'interno del reticolo endoplasmico (RE). Queste proteine contengono al loro ter- 
minale aminico una sequenza di aminoacidi fondamentalmente idrofobici, chia- 
mata sequenza segnale, che indirizza il complesso ribosoma-proteina alla mem- 
brana del RE. Dopo che la proteina in corso di sintesi è stata introdotta nel RE, il 
segnale viene tagliato. La proteina viene quindi trasportata dall’apparato del Golgi 
alla sua destinazione finale, o se contiene al suo terminale carbossilico il segnale 
(sequenza KDEL) viene trattenuta nel RE (Munro e Pelham, 1987). 


Tecniche di base 
nell’analisi dei geni 


Concetti chiave 


+ La scoperta contemporanea degli enzimi di restrizione, della trasfor- 
mazione batterica e dell’elettroforesi su gel di agarosio ha avviato, 
negli anni settanta, lo sviluppo della biologia molecolare 


+ È diventato possibile tagliare il DNA in siti definiti e riunire molecole 
di DNA distinte 


+ È diventato fattibile il clonaggio, cioè lo studio di singoli geni isolati 
+ Analisi ad alta risoluzione del DNA utilizzando i gel 
+ Le tecniche di blotting per rilevare sequenze nucleotidiche omologhe 


+ La purificazione rapida del DNA 


Uno dei maggiori problemi nell'analisi dei geni è rappresentato dalla natura rela- 
tivamente uniforme della molecola di DNA. Come abbiamo già visto, il DNA 
che costituisce il genoma umano è molto lungo (la maggior parte delle cellule 
contiene circa 6,4 Xx 10° coppie di basi) e costituito da solo quattro differenti nu- 
cleotidi. Questa dimensione e la relativa assenza di complessità fa apparire l’iso- 
lamento e lo studio di singoli frammenti di DNA un obiettivo difficile da rag- 
giungere. Sappiamo che la sequenza di basi del DNA è fondamentale per codifi- 
care l’informazione genetica, ma per studiare la funzione di un singolo gene è 
essenziale che il gene stesso sia isolato dal resto del genoma. La tecnica ideale, 
dovrebbe prevedere la possibilità di isolare un singolo gene dal genoma. Fino 
agli anni settanta non furono disponibili metodi per tagliare il DNA a livello di 
sequenze specifiche e la capacità di frammentarlo a livello di siti ben definiti, è 
diventata la pietra miliare della biologia molecolare. Ciò si ottiene attraverso l’u- 
tilizzo di enzimi, detti enzimi di restrizione, la cui scoperta ha portato nel 1978 
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al conseguimento del premio Nobel da parte di Werner Arber, Daniel Nathans e 
Hamilton O. Smith. 

Pensando al modo in cui potremmo isolare un particolare frammento di DNA, 
dobbiamo prendere in considerazione diversi fattori importanti. Si ha la necessità di 
isolare il frammento di DNA di interesse e di clonarlo affinché possa essere repli- 
cato e amplificato in assenza di altri geni umani. Come è possibile raggiungere que- 
sto obiettivo? Il metodo favorito per studiare la funzione di un gene è di clonarlo nel 
batterio più utilizzato dai biologi molecolari: Escherichia coli. E. coli mostra parec- 
chi vantaggi che lo rendono utile per il clonaggio di geni: le cellule crescono velo- 
cemente, la sua genetica è ben conosciuta e alcuni ceppi sono stati ingegnerizzati 
per renderli non pericolosi per la nostra salute. Esistono tuttavia parecchi problemi 
associati all’inserimento di sequenze di DNA esogeno nei batteri. In generale, le 
sequenze di DNA si replicano solamente se contengono un replicone. Il genoma 
di virus e batteri contiene un solo replicone, quindi mettendo semplicemente un 
frammento di DNA esogeno all’interno di un batterio non si potrà osservare la re- 
plicazione di quel DNA. In effetti, il destino più probabile di un frammento di 
DNA esogeno introdotto nei batteri è la sua degradazione. Negli anni cinquanta 
era stato notato che se una batteriofago era preparato in un particolare ceppo di 
E. coli (supponiamo il ceppo C) poteva infettare molto efficacemente le cellule di 
quel ceppo. Inoltre, il batteriofago poteva infettare con un’efficienza molto più 
bassa altri ceppi di E. coli (come il ceppo K). È da notare che alcuni batteriofagi 
preparati nel ceppo K potevano efficientemente infettare entrambi, sia K che C. Il 
mantenimento del batteriofago prodotto nel ceppo C era in qualche modo impe- 
dito nel ceppo K. Werner Arber aveva notato che il DNA del batteriofago prepa- 
rato utilizzando il ceppo C era rapidamente degradato dopo il suo ingresso nel 
ceppo K (Arber, 1965). La degradazione avviene perché i batteri contengono un 
sistema di restrizione-modificazione specificamente progettato per proteggersi da 
sequenze di DNA esogeno. 


2.1 Enzimi di restrizione 


I sistemi di restrizione-modificazione batterici contengono due componenti: una 
endonucleasi di restrizione e una DNA metilasi. L'enzima di restrizione (o en- 
donucleasi di restrizione) taglia il DNA a livello di specifiche sequenze; il ter- 
mine “endonucleasi” è utilizzato per identificare le nucleasi sequenza-specifiche 
che tagliano il DNA in qualche sito al suo interno, piuttosto che alle estremità 
della molecola. Il primo enzima di restrizione ad essere isolato è stato, nel 1968, 
quello dal ceppo K di £. coli (Meselson e Yuan, 1968). L'enzima era in grado di 
tagliare il DNA, ma il sito preciso di taglio era sconosciuto. Inoltre, l’enzima 
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Tabella 2.1. Caratteristiche delle endonucleasi di restrizione. Adattato da Dryden, Murray e 


Rao (2001) 


Proprietà 


Tipo I 


Tipo II 


Tipo II 


Restrizione e 


Singolo enzima 


Nucleasi e metilasi 


Enzimi separati che 


modificazione multifunzionale separate condividono una 
subunità comune 
Struttura della Eterotrimero Omodimero Eterodimero 
subunità 
nucleasica 
Cofattori ATP, Mg°*, SAM Mg?* Mg?* (SAM) 
Richieste per il Due siti di Singolo sito di Due siti di 
taglio del DNA riconoscimento riconoscimento riconoscimento in 
in qualsiasi orientamento 
orientamento invertito 
Sito di taglio Casuale, circa 1000 A livello o vicino 24-26 bp dal 3° 
nel DNA bp lontano al sito del sito 
dal sito di riconoscimento di riconoscimento 
Turnover No Sì Sì 
enzimatico 
Traslocazione Sì No No 
del DNA 
Sito di metilazione Nel sito di Nel sito di Nel sito di 
riconoscimento riconoscimento riconoscimento 


mostrava un certo numero di attività complesse che resero difficile il suo studio 
(Tabella 2.1). 

Nel 1970, Hamilton Smith e collaboratori isolarono un enzima di restrizione 
dal ceppo Rd del batterio Haemophilus influenzae che possedeva la capacità di ta- 
gliare il DNA a livello di specifiche sequenze. L'enzima, chiamato HindII, ricono- 
sce una sequenza di sei basi nel DNA a doppio filamento costituita da 5°-G-T-piri- 
midina-purina-A-C-3°: 


5°-GT(T/C) | (G/A)AC-3' 
3-CA(A/G) ; (C/T)TG-5" 


e taglia entrambi i filamenti nel centro della sequenza (il punto di taglio è indi- 
cato dalla linea). Smith scoprì che l’enzima non era in grado di tagliare il DNA 
genomico di Haemophilus influenzae, ma tagliava in oltre 40 punti il genoma 
del batteriofago T7 (lungo 39.937 coppie di basi), fornendo un quadro di fram- 
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mentazione molto specifico. L'enzima di restrizione HindII riconosce sempre la 
stessa sequenza e la taglia sempre nel centro. Questa sequenza è nota come il 
sito di riconoscimento di HindII. L'enzima HindII taglierà il DNA in qualsiasi 
punto della molecola si trovi questa particolare sequenza di sei basi non modi- 
ficata. 

In effetti, Smith fu molto fortunato. Haemophilus influenzae contiene due dif- 
ferenti enzimi di restrizione, HindII e HindIII, che probabilmente erano entrambi 
presenti nel suo estratto di attività enzimatica parzialmente purificato. HindIII rico- 
nosce e taglia la sequenza 5°-AAGCTT-3°, che non è presente all’interno del ge- 
noma del batteriofago T7, e che quindi non poteva interferire con il quadro di dige- 
stione ottenuto. 

Poco dopo la scoperta di Smith, fu isolato e caratterizzato dal ceppo RY13 di 
E. coli un altro enzima di restrizione: EcoRI (Hedgpeth, Goodman e Boyer, 
1972). Questo enzima mostrava il sito di riconoscimento 5°’-GAATTC-3°. Da al- 
lora più di 900 enzimi di restrizione sono stati isolati da 230 specie batteriche. 
Gli enzimi di restrizione posseggono dei nomi che riflettono la loro origine: la 
prima lettera rappresenta il genere, mentre la seconda e terza lettera indicano la 
specie batterica da cui sono stati isolati. Per convenzione, le lettere erano scritte 
in corsivo, ma recentemente questo è cambiato ed ora sono scritte con caratteri 
normali (Roberts ef al., 2003). Il numero romano che segue il nome dell’enzima 
indica l’ordine in cui l'enzima è stato isolato dal ceppo batterico. Per esempio, il 
primo enzima ad essere isolato dal batterio Providencia stuartii è denominato 
PstI, mentre il secondo enzima isolato dal ceppo ET del Bacillus stearother- 
mophilus è denominato BstEll. 

A questo punto una domanda pertinente è: perché il DNA di un organismo che 
produce un certo enzima di restrizione non è attaccato da quello stesso enzima? 
Negli esperimenti descritti sopra, Smith fu in grado di osservare il taglio del DNA 
di T7 da parte di HindII, ma non il taglio del DNA di Haemophilus influenzae da 
cui l’enzima deriva, anche se il DNA conteneva molti siti di riconoscimento per lo 
stesso enzima. La ragione di questa incongruenza risiede nel meccanismo di cam- 
biamento del sistema di restrizione-modificazione. Haemophilus influenzae, come 
tutti gli organismi che producono enzimi di restrizione, produce anche enzimi che 
modificano il proprio DNA in modo tale che non venga tagliato dall’enzima di re- 
strizione. Per esempio, il ceppo RY13 di £. coli, che produce EcoRI, produce de 
che la metilasi EcoRI; i due geni sono adiacenti nel genoma, situazione comune 
ad altre specie batteriche. La metilasi EcoRI attacca gruppi metilici alla posizione 
N6 (Fig. 1.5) del secondo residuo di adenina del sito di riconoscimento EcoRI e 
questa modificazione covalente rende il sito non tagliabile dall’enzima di restri- 
zione (Fig. 2.1). Effettivamente, la metilazione del sito EcoRI in un solo filamento 
di DNA è sufficiente per prevenire il taglio da parte dell’enzima di restrizione. La 


2.1 ENZIMI DI RESTRIZIONE 69 


EcoRI metilasi 


EcORI 
——T_-» Assenza di taglio 


Emimetilato 


3 
Ge A AT T G 
Bodo HM 


cTUTE AG 


Totalmente metilato 


Figura 2.1. Protezione per modificazione del taglio del DNA. L'enzima di restrizione EcoRI riconosce 
e taglia la sequenza 5°-GAATTC-3°. | ceppi R di E. coli, da cui l'enzima deriva, proteggono il loro 
DNA dalla frammentazione producendo anche una metilasi specifica. La metilasi EcoRI trasferisce 
un gruppo metile dalla S-adenosilmetionina e lo lega all’atomo N6 della seconda adenina del sito di 
riconoscimento. L'enzima EcORI non è in grado di tagliare il DNA così metilato. 


resistenza al taglio del DNA emimetilato protegge i batteri dalla degradazione su- 
bito dopo la replicazione semiconservativa della sequenza totalmente metilata, fin- 
ché la metilasi EcoRI non ripristina lo stato di completa metilazione. La metila- 
zione delle adenine nel sito di riconoscimento EcoRI non altera la generale strut- 
tura del DNA, ma inibisce il taglio da parte dell'enzima (Jen-Jacobsen er al., 
1966). Gli enzimi di metilazione del DNA (anche chiamati DNA metiltransferasi) 
funzionano utilizzando un meccanismo ingegnoso per aggiungere i gruppi metilici 
a basi specifiche del DNA. Un certo numero di questi enzimi è stato studiato da un 
punto di vista strutturale (Fig. 2.2). Il legame della metilasi al DNA provoca lo 
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Figura 2.2. La struttura della metilasi Hha/ legata al DNA. L'enzima (in bianco) inserisce un amino- 
acido (in blu scuro) nel suo sito di riconoscimento a livello del DNA (5’--GCGC-3’) e sposta il primo 
residuo C (verde) fuori dall’asse dell’elica (Blumental e Cheng, 2001). Il residuo è metilato utilizzando 
la S-adenosilmetionina come donatore (mostrato in giallo oro). Quando l’enzima si dissocia, la base 
metilata probabilmente ritorna nella sua posizione originale. Riprodotto da Blumental e Cheng, 
(2001) con l’autorizzazione di Xiaodong Chen (Università di Emory). 


spostamento della base da metilare e la stabilizzazione nell’elica della base orfana 
da parte di altre regioni della proteina. Il movimento della base coinvolge la rota- 
zione dei legami dello scheletro del DNA per poterla esporre al di fuori della strut- 
tura, affinché possa essere il substrato per la reazione chimica catalizzata dall’en- 
zima (Cheng e Roberts, 2001). 

Quindi, l'organismo mentre degrada il DNA estraneo che non è correttamente 
metilato, è in grado di proteggere il proprio DNA. Come vedremo più avanti, le 
metilasi sono importanti strumenti dei ricercatori che in vitro vogliono proteggere 
certe sequenze di DNA dal taglio con enzimi di restrizione. 


2.1.1 Tipi di sistemi di restrizione-modificazione 


I sistemi di restrizione-modificazione, sulla base della complessità enzimatica (ri- 
chiesta di cofattori e posizione del taglio nel DNA), possono essere suddivisi in tre 
tipologie, benché siano stati scoperti nuovi sistemi che non rientrano in questa 
classificazione. Le caratteristiche di ogni tipologia sono riassunte in Tabella 2.1. 
L’enzima di restrizione EcoK, il primo ad essere isolato nel 1968, è una endonu- 
cleasi di tipo I che riconosce la sequenza di DNA 5°-AACN,GTGC-3" (dove N può 
essere qualsiasi nucleotide), ma taglia in modo apparentemente casuale abbastanza 
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lontano dal sito di riconoscimento. Gli enzimi di restrizione di tipo I richiedono per 
l’attività ATP, S-adenosilmetionina (SAM) e ioni magnesio (Mg?*). Questi enzimi 
sono costituiti da tre subunità: una subunità specifica per il riconoscimento del 
sito sul DNA, una subunità di modificazione ed una subunità di restrizione. In 
presenza di SAM, l’enzima si lega al sito indipendentemente dal suo stato di meti- 
lazione. Se il sito di riconoscimento è metilato, l’idrolisi di ATP induce la disso- 
ciazione dell'enzima dal DNA. Se, al contrario, il sito è emimetilato 1’ ATP sti- 
mola la metilazione dell’altro filamento, utilizzando SAM come donatore del 
gruppo metile. Se il sito non è metilato avviene il taglio del DNA, parecchie kb 
lontano dal sito di riconoscimento. Il DNA compreso tra il sito di riconoscimento 
e quello di taglio forma un’ansa che fuoriesce dall’enzima. La natura casuale del- 
l’evento di taglio esclude l’utilizzo di questi enzimi negli esperimenti di ingegne- 
ria genetica. 

Le endonucleasi di restrizione HindII, HindIII e EcoRI sono esempi di enzimi 
di tipo II. Riconoscono sequenze di DNA che se ruotate sono simmetriche (la se- 
quenza del DNA di un filamento in direzione 5° > 3’ è la stessa dell’altro fila- 
mento nella stessa direzione). Sequenze di DNA con queste caratteristiche sono 
spesso identificate come palindromi. Il sito palindromico può essere continuo (ad 
esempio KpnI riconosce la sequenza 5°-GGTACC-3’) o interrotto (ad esempio 
BstII riconosce al sequenza 5°-GGTNACC-3°, dove N può essere qualsiasi nucleo- 
tide). Gli enzimi di tipi II per la loro attività richiedono solo ioni magnesio e nor- 
malmente tagliano il DNA all’interno del sito o in una posizione molto vicina. I 
differenti enzimi di tipo II riconoscono e tagliano differenti siti, ma un singolo en- 
zima taglierà sempre in corrispondenza di una specifica sequenza di DNA, indi- 
pendentemente dall’origine del DNA. Differenti enzimi di restrizione isolati da 
fonti diverse spesso riconoscono la stessa sequenza, benché possano tagliare il 
DNA in modo diverso; questi enzimi sono definiti isoschizomeri. Per esempio, 
entrambi gli enzimi di restrizione Smal e Xmal riconoscono la sequenza di DNA 
5-CCCGGG-3° e sono quindi isoschizomeri, ma mentre Smal taglia nel mezzo del 
sito tra i nucleotidi C e G, Xmal taglia ogni filamento del DNA dopo il primo nu- 
cleotide C. 

Gli enzimi di restrizione di tipo III funzionano come complessi costituiti da 
due diverse subunità: una subunità (M) è responsabile del riconoscimento e della 
modificazione del DNA, e l’altra subunità (R) è responsabile dell’attività nuclea- 
sica. Il taglio del DNA richiede ioni magnesio, ATP ed è stimolata da SAM. I siti 
di riconoscimento sono approssimativamente simmetrici, ed il taglio avviene su un 
filamento ad una distanza definita da una parte della sequenza di riconoscimento. 
Per entrambi i filamenti della doppia elica sono quindi necessari due siti di ricono- 
scimento in orientamento invertito. 
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2.1.2 Altri sistemi di modificazione 


La maggior parte dei ceppi di £. coli utilizzati in laboratorio contengono tre si- 
stemi di metilazione sito-specifica del DNA (Fig. 2.3). La modificazione del DNA 
da parte di questi sistemi porta alla protezione del taglio di eventuali siti di ricono- 
scimento per enzimi di restrizione. Di conseguenza, la conoscenza della sensibilità 
degli enzimi di restrizione alla metilazione del DNA conferita da questi sistemi in 
E. coli è di grande importanza per l’ingegneria genetica. 


(a) Metilazione Dam. La metilasi codificata dal gene Dam metila la posizione N6 
(Fig. 1.5) del residuo di adenina nella sequenza 5°-GATC-3°. Questa metila- 
zione dell’adenina non impedisce il suo appaiamento con la timina. La metila- 
zione Dam è stata correlata a svariate funzioni cellulari, incluso la replicazione 
del DNA. La metilasi Dam è un enzima con attività relativamente bassa, per 
cui il DNA neosintetizzato sarà emimetilato in quanto il vecchio filamento sarà 
metilato, mentre il nuovo non lo sarà (Campbell e Kleckner, 1988). Tuttavia, 
più tardi entrambi i filamenti saranno metilati. Questo è importante in quanto 
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Figura 2.3. Sistemi di restrizione e modificazione trovati nei ceppi K di E. coli. Localizzazione geno- 
mica dei sistemi di restrizione-modificazione nel ceppo K12 di E. coli. Il cerchio rappresenta il ge- 
noma batterico, con i numeri interni che indicano la localizzazione fisica. E. coli contiene due sistemi 
di modificazione di tipo Il (Dam e Dcm) e due sistemi di restrizione-modificazione di tipo ! (Mer e 
EcoKI). Le metilasi, enzimi di restrizione e subunità di specificità sono identificate da diversi colori 
come indicato. ; 
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lo stato di metilazione dell’origine di replicazione (oriC) di E. coli controlla 
se la replicazione sarà effettuata o meno. Se entrambi i filamenti di DNA a li- 
vello di oriîC saranno metilati, il DNA verrà duplicato. Al contrario, in pre- 
senza della metilazione di un solo filamento, oriC non è attivo e non si osser- 
verà l’inizio della replicazione. La lenta rimetilazione di oriC dopo un ciclo re- 
plicativo ritarda un’ulteriore replicazione fino a che la precedente non è stata 
completata (Freiesleben et al., 2000). 


(b) Metilazione Dem. La metilasi codificata dal gene Dem metila la posizione CS 
della citosina interna nella sequenza 5°--CCWGG-3", dove W può essere sia A 0 
T. Il ruolo preciso della metilazione Dmc nelle cellule rimane oscuro in quanto 
in E. coli la delezione del gene non produce alcun fenotipo (Palmer e Marinus, 
1994). 


(c) Sistema Mcr. Negli anni ‘80 diventò chiaro che il DNA estratto da diverse 
fonti batteriche e eucariotiche poteva essere clonato in certi ceppi di £. coli 
con un'efficienza estremamente bassa. La ragione risiedeva nel fatto che il 
DNA estraneo era degradato dall’ospite. Il fenomeno è causato dalla metilci- 
tosina presente nel DNA ed è definito restrizione da citosina modificata 
(Mrc). Un sistema Mrc è codificato da due geni, MrcB e MrcC, presenti nel 
genoma di E. coli in vicinanza del locus per la restrizione-modificazione 
EcoKI (Fig. 2.3). Le proteine codificate dai due geni riconoscono la sequenza 
di DNA 5°-R-mC-N,j gg-R-mC-3°, dove R può essere A 0 G, N è qualsiasi nu- 
cleotide e mC è la citosina metilata. Il taglio avviene in siti multipli su en- 
trambi i filamenti tra le citosine metilate e richiede GTP per traslocare il DNA 
tra i due siti di legame 5°-R-mC-3’” (Panne, Raleigh e Brikle, 1999; Stewart er 
al., 2000; Panne et al., 2001). 


La metilazione Dam- e Dcm-dipendente può interferire con il taglio degli enzimi 
di restrizione che presentano siti di riconoscimento completamente, o parzial- 
mente, sovrapposti ai siti di metilazione. Per esempio, Mbol (sequenza di ricono- 
scimento 5°-GATC-3°) non taglia il DNA metilato dalla Dam, mentre il suo iso- 
schizomero Bsp143I non è sensibile alla stessa metilazione. Similmente, EcoRII 
(5-CCWGG-3' in cui W = A o T) non taglia il DNA metilato da Dem, al contrario 
del suo isoschizomero Mval. 

La natura precisa del taglio effettuato dagli enzimi di restrizione di tipo II li 
rende molto utili per le finalità dell’ingegneria genetica. Tuttavia, anche i sistemi di 
metilazione vanno tenuti in considerazione, poiché devono essere obbligatoria- 
mente rimossi dalla cellula ospite in cui sarà inserito il DNA esogeno che poi do- 
vrà essere tagliato in determinati siti. 
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2.1.3 Come funzionano gli enzimi di restrizione di tipo II? 


Benché tutti gli enzimi di tipo II studiati mostrino una scarsa se non nulla omo- 
logia di sequenza aminoacidica, la loro struttura tridimensionale possiede un 
core catalitico molto conservato, composto da cinque foglietti-B intrecciati, 
fiancheggiati da due &-eliche (Kovall e Matthews, 1999). Gli enzimi di restri- 
zione sembrano effettuare una “scansione” del DNA con un legame aspecifico 
(Pingoud e Jeltsch, 2001); quando l’enzima incontra la sua specifica sequenza 
di riconoscimento, va incontro ad un cambiamento conformazionale che attiva 
il sito catalitico. L'enzima effettua quindi un taglio a livello di ognuno dei 
due legami fosfodiesterici della doppia elica per produrre estremità 3°-OH e 
5°-P (Fig. 2.4). La posizione dei due tagli, sia l’uno rispetto all’altro sia rispetto 
alla completa sequenza di riconoscimento, è determinata dallo specifico enzima 
di restrizione. Quando sono stati effettuati i tagli, la molecola di DNA si 
dividerà in frammenti. Non tutti gli enzimi di restrizione tagliano in modo 
simmetrico, originando estremità piatte (blunt) come HindII descritto prima. 
Molti enzimi tagliano i legami fosfodiesterici in posizioni che non sono diretta- 
mente opposte e di conseguenza lasciano estremità sporgenti al 5° o al 3° 
(Fig. 2.5). 


Figura 2.4. La struttura dell'enzima di restrizione BamHI legato al DNA. L'enzima riconosce la 
sequenza di DNA 5°-GGATCC-3' e taglia il legame fosfodiesterico tra le due G. Questo produce la 
formazione di due frammenti di DNA con estremità sporgenti, anche chiamate estremità coesive o 
appiccicose. La proteina è un dimero di subunità uguali (colorate in verde e azzurro). 
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Figura 2.5. Il taglio da parte di enzimi di restrizione di tipo II. Diversi enzimi di restrizione ricono- 
scono differenti sequenze di DNA e tagliano originando estremità coesive o piatte. È mostrato il sito 
di riconoscimento di ogni enzima, insieme al sito di taglio (indicato dalle linee blu). Dopo il taglio, i 
deboli legami idrogeno che tengono unite le estremità sporgenti si rompono, originando due nuove 
estremità. 


Si consideri ad esempio l’enzima EcoRI e la sua sequenza di riconoscimento 
5°-GAATTC-3’; quando l’enzima incontra tale sequenza taglia ogni legame cova- 
lente tra la G e la A più vicina (Mertz e Davis, 1972). Effettuati i tagli, i frammenti 
risultanti saranno tenuti insieme solamente da deboli legami a idrogeno tra le quat- 
tro coppie di basi complementari interne ai tagli. La debolezza di questi legami 
permette che i frammenti di DNA si separino l’uno dall’altro. Ogni frammento ha 
un'estremità 5’ sporgente costituita da basi non appaiate (a singolo filamento). Per 
esempio, altri enzimi come Pstl effettuano tagli all’interno del DNA caratterizzati 
da estremità 3’ sporgenti. Le estremità sporgenti, sia 5’ che 3’, anche definite estre- 
mità ‘“appiccicose” o ‘“coesive”, potranno legarsi con sequenze di basi complemen- 
tari. In altre parole, se una sequenza di basi non appaiata (ad esempio 5°-AATT-3°) 
incontra un’altra sequenza non appaiata (ad esempio 3'-TTAA-5”), esse si leghe- 
ranno essendo appiccicose l’una rispetto all'altra. Benché i frammenti di DNA con 
estremità appiccicose compatibili possano associarsi mediante la formazione di le- 
gami idrogeno tra le basi complementari, non sono in grado di formare uno schele- 
tro zucchero-fosfato continuo. Le interruzioni nello scheletro del DNA a livello 
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delle estremità appiccicose appaiate possono essere riparate con l’enzima DNA li- 
gasi (vedi oltre). L'origine cellulare, o anche la specie di origine, delle estremità 
appiccicose non influenza minimamente le loro caratteristiche. Qualsiasi coppia di 
sequenze complementari avrà la tendenza a legarsi anche se una sequenza deriva 
da DNA umano e l’altra da DNA batterico. 

Con quale frequenza i siti di riconoscimento di un enzima di restrizione com- 
paiono in una determinata sequenza di DNA? La maggior parte degli enzimi di re- 
strizione che abbiamo considerato fino ad ora riconosce sequenze di DNA con una 
lunghezza di sei coppie di basi. Tuttavia, altri enzimi riconoscono sequenze più 
lunghe (sette o otto coppie di basi) o più corte (quattro o cinque coppie di basi). La 
lunghezza della sequenza di riconoscimento determina la frequenza di taglio di una 
particolare molecola di DNA. Ci si aspetta che ogni enzima di restrizione che pos- 
siede una sequenza bersaglio di quattro coppie di basi taglierà una sequenza di 
DNA casuale una volta ogni 44 (256) coppie di basi, assumendo che le quattro basi 
siano presenti con la stessa frequenza. Ogni sito di sei coppie di basi è atteso es- 
sere presente una volta ogni 4° (4,096) coppie di basi, e uno di otto ogni 48 
(65,536) coppie di basi. Quindi, la digestione di DNA genomico con, per esempio, 
EcoRI produrrà la formazione di una serie di frammenti con una taglia media di 4 
kb. La frequenza effettiva di taglio di un particolare enzima dipenderà ovviamente 
dalla frequenza con cui compariranno in quel particolare DNA le basi che costi- 
tuiscono il suo sito di riconoscimento. Come abbiamo visto nel Capitolo 1, Char- 
gaff aveva osservato che in differenti organismi la percentuale dei residui G + C 
differisce da quella A + T. Queste differenze, spesso definite come il contenuto 
GC di un genoma, rappresentano all’interno di un genoma la percentuale di nu- 
cleotidi che sono G o C. Gli enzimi di restrizione che posseggono siti di ricono- 
scimento con una proporzione elevata di residui G e C taglieranno il DNA poco 
frequentemente se il genoma presenterà un basso contenuto medio di GC. Inoltre, 
il genoma degli eucarioti superiori ha la tendenza a contenere un minor numero di 
coppie 5’-CG-3’ (anche definite CpG) di quanto predetto per caso (Bird, 1980). Di 
conseguenza, gli enzimi di restrizione che tagliano sequenze contenenti questo 
motivo taglieranno il DNA degli eucarioti superiori meno frequentemente di 
quanto atteso. 


2.2 Legare le molecole di DNA 


La scoperta degli enzimi di restrizione ha reso possibile il taglio di molecole di 
DNA a livello di siti specifici. Il problema successivo è rappresentato dalla possibi- 
lità di unire due molecole di DNA. Alla fine degli anni sessanta, parecchi laboratori 
scoprirono simultaneamente la DNA ligasi, un enzima che catalizza la formazione 
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di un legame fosfodiesterico tra due filamenti di DNA (Wiess e Richardson, 1967: 
Zimmermann et al., 1967). L'enzima DNA ligasi richiede la presenza di un gruppo 
ossidrilico libero all’estremità 3’ di un filamento di DNA e di un gruppo fosfato 
all’estremità 5’ dell’altro. La formazione di un legame fosfodiesterico tra questi 
due gruppi richiede energia. In £. coli e in altri batteri, il NAD* svolge questo 
ruolo, mentre nelle cellule animali e nei batteriofagi la reazione è guidata dal- 
l’ATP. Le DNA ligasi sono in grado di unire due molecole di DNA a doppio fila- 
mento, ma non due molecole a singolo filamento. Come visto nel Capitolo 1, il 
ruolo delle DNA ligasi è di saldare le interruzioni presenti nello scheletro del 
DNA dopo la replicazione. Questo meccanismo è essenziale per il normale pro- 
cesso di replicazione del DNA e per la riparazione del DNA danneggiato, ed è 
stato sfruttato in ingegneria genetica per la creazione di molecole di DNA ricom- 
binante. 

Il meccanismo d’azione delle DNA ligasi è stato studiato in dettaglio (Timson, 
Singleton e Wingley, 2000). L’ATP, o il NAD*, reagiscono con l’enzima per for- 
mare un complesso covalente enzima-AMP, nel quale 1’ AMP è legato con un le- 
game fosfoamidico ad un gruppo £-aminico di un residuo di lisina nel sito attivo 
dell’enzima (Fig. 2.6). L’AMP attiva il gruppo fosfato all’estremità 5° del DNA che 
deve essere legato. Il passaggio finale è rappresentato da un attacco nucleofilo del- 
l’ossidrile al 3’ sull’atomo di fosforo attivato. Si forma il legame fosfodiesterico e 
lVAMP viene rilasciato. La sequenza di reazioni è guidata dall’idrolisi del pirofo- 
sfato che è stato rilasciato durante la formazione del complesso enzima-adenilato. 
Quindi, se si utilizza l’ ATP, la formazione del legame fosfodiesterico nel DNA ri- 
chiede il consumo (idrolisi) di due legami fosfato ad alta energia. 

La temperatura ottimale per il riparo del DNA che presenta dei nick è di 
37°C, ma a questa temperatura i legami idrogeno tra due estremità coesive di un 
DNA tagliato con un enzima di restrizione saranno instabili. Per esempio, le 
estremità originate da EcoRI si associano solo mediante quattro coppie di basi 
AT e queste non sono sufficienti per resistere a tali temperature elevate. La tem- 
peratura ottimale per legare le estremità coesive di frammenti di DNA originate 
per taglio con enzimi di restrizione è un compromesso tra la velocità dell’atti- 
vità enzimatica e l’associazione dei frammenti di DNA. Quindi l’optimum di 
temperatura per tali reazioni è tra 4 e 20°C (Sgaramella e Ehrlich, 1978). La 
DNA ligasi di E. coli legherà frammenti di DNA con estremità piatte, solamente 
se presenti a concentrazione molto elevata. Si pensa che un’alta concentrazione 
promuova le collisioni dei frammenti che favoriranno il riparo. La DNA ligasi 
estratta dal batteriofago T4 è in grado di legare i frammenti di DNA con estre- 
mità piatte anche se con una efficienza inferiore rispetto a quelle coesive (Fer- 
retti e Sgaramella, 1981). In Fig. 2.7 è mostrato uno schema generale di taglio e 
riparo di molecole di DNA. 
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Figura 2.6. Il meccanismo di saldatura del DNA da parte della DNA ligasi. Vedere il testo per i detta- 
gli. La figura è adattata da Doherty et a/. (1996). 


2.3 La base del clonaggio 


La capacità di tagliare e riunire le molecole di DNA ha portato nel 1972 al primo 
esperimento di clonaggio del DNA (Jackson, Symons e Berg, 1972). Per la prima 
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Figura 2.7. Taglio e riunione del DNA con enzimi di restrizione e DNA ligasi. Il DNA lineare (inserto) 
e il DNA plasmidico circolare chiuso (vettore) contengono entrambi i siti di riconoscimento per 
BamHI e EcoORI. Il mescolamento dei frammenti con estremità compatibili in presenza di DNA ligasi 
può risultare nella formazione di molecole di DNA ibride inserto-vettore. 


volta fu possibile estrarre un frammento di DNA da una sorgente ed inserirlo, 0 
clonarlo, nel DNA proveniente da un’altra sorgente. Forse, il tipo più comune di 
esperimento di clonaggio implica l’inserimento di un frammento di DNA estra- 
neo in un vettore appropriato, affinché il frammento esogeno possa essere propa- 
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gato in £. coli. Nel capitolo 3 saranno illustrati i diversi tipi di vettore attualmente 
disponibili, ma a questo punto possiamo considerare il vettore come una molecola 
di DNA plasmidico a doppio filamento covalentemente chiusa. Se vogliamo inse- 
rire delle sequenze di DNA esogeno in questo vettore, si ha prima la necessità di 
tagliarlo per produrre una molecola lineare alla quale possiamo poi attaccare altre 
sequenze di DNA utilizzando la ligasi. 

Consideriamo l’inserzione di DNA nel vettore utilizzando due differenti enzimi 
di restrizione (Fig. 2.7). La digestione del vettore e del DNA esogeno con questi 
due enzimi originerà una serie di frammenti. Nel vettore, i siti di riconoscimento 
per gli enzimi di restrizione sono localizzati uno vicino all’altro; come vedremo 
nel Capitolo 3, questa caratteristica è molto comune nei plasmidi ingegnerizzati. Il 
taglio di un tale vettore con BamHI e EcoRI origina due frammenti: uno grande 
che comprende la maggior parte del vettore e uno piccolo che rappresenta la re- 
gione tra i due siti di riconoscimento. In presenza di DNA ligasi, nessuno dei due 
frammenti è in grado di legare con se stesso, in quanto le estremità non sono com- 
patibili l'una con l’altra. La digestione del DNA lineare da inserire nel vettore con 
gli stessi due enzimi produce tre frammenti, dei quali solo uno contiene delle estre- 
mità compatibili con BamHI e EcoRI. Gli altri due frammenti rappresentano le 
estremità del DNA esogeno. Il mescolamento del vettore e del frammento di DNA 
da inserire compatibili l'uno con l’altro, produrrà la formazione di legami a idro- 
geno tra le due molecole di DNA. L’aggiunta di DNA ligasi alla struttura interme- 
dia unita da legami a idrogeno risulterà nella saldatura dello scheletro del DNA e 
nella formazione di una molecola di DNA ibrida costituita da vettore e inserto. Se 
un altro dei frammenti di DNA risultasse unito da legami idrogeno al vettore, sup- 
poniamo attraverso la sua estremità BamHI compatibile, la successiva ligazione 
non sarà in grado di produrre una molecola circolare chiusa. Come vedremo nel 
prossimo paragrafo, questo tipo di molecole di DNA non possono essere replicate 
se sono inserite nei batteri. 

Questo schema di clonaggio funziona perché il vettore tagliato con due en- 
zimi di restrizione non contiene estremità complementari. Se il vettore fosse stato 
tagliato con un unico enzima, o con due enzimi che però originano delle estre- 
mità compatibili, il vettore avrebbe potuto facilmente circolarizzare su se stesso 
in presenza di DNA ligasi. Tuttavia, il trattamento del vettore tagliato con l’en- 
zima fosfatasi impedisce la sua circolarizzazione, in quanto la fosfatasi catalizza 
la rimozione dagli acidi nucleici e dai nucleotidi trifosfato del fosfato al 5’. Poi- 
ché i frammenti di DNA trattati con la fosfatasi non presentano il fosfato al 5’ ri- 
chiesto dalla ligasi, questo trattamento impedirà la ligazione del vettore su sè 
stesso (self-ligation) e favorirà la formazione di ibridi di DNA inserto-vettore. 
Questo schema di clonaggio è rappresentato schematicamente in Fig. 2.8. Una 
volta che il vettore è stato trattato con la fosfatasi, la DNA ligasi è in grado di sal- 
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Figura 2.8. Schema di base del clonaggio in un vettore plasmidico contenente un singolo sito di ri- 
conoscimento per un enzima di restrizione. Il vettore contiene un singolo sito EcoRI, mentre l'inserto 
ne contiene due. Il taglio di entrambi con l'enzima produce i frammenti mostrati. L'aggiunta della li- 
gasi al vettore tagliato probabilmente produce la sua riformazione. Questo si può prevenire trattando 
il vettore tagliato con la fosfatasi per rimuovere i residui 5’ fosfato dalle estremità del DNA. L'inserto 
tagliato può fornire i fosfati mancanti richiesti dalla ligasi. Quindi il mescolamento di vettore e inserto 
produrrà la formazione di una molecola di DNA ibrida. 
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Figura 2.9. Ligazione tra il DNA del vettore trattato con fosfatasi e'un inserto compatibile. Il vettore è 
tagliato con l'enzima di restrizione EcoRI e quindi trattato con fosfatasi per rimuovere i fosfati dalle 
estremità 5’ libere. La ligazione di un inserto compatibile con questo vettore risulterà nella saldatura 
delle sole estremità 5° dell’inserto. Le estremità 3’ dell’inserto (gruppo —OH) e quelle 5’ del vettore 
(anch'esse —OH) non saranno in grado di risaldarsi. Tuttavia, la trasformazione nei batteri dell’ibrido 
inserto-vettore permetterà la riparazione dei filamenti di DNA interrotti per formare una molecola di 
inserto e vettore totalmente integra. 
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dare le interruzioni (nick) nello scheletro fosfodiesterico del DNA solamente in un 
filamento (Fig. 2.9). Tuttavia, una volta che queste molecole sono introdotte per 
trasformazione nei batteri, l'interruzione dell’altro filamento è saldata dal sistema 
di riparazione del DNA. 

Durante il clonaggio di frammenti di DNA può accadere che i siti di riconosci- 
mento degli enzimi di restrizione necessari non siano presenti, o siano localizzati 
in una posizione non corretta. Questo inconveniente può essere superato in svariati 
modi. 


* Clonare all’interno di un sito di restrizione piatto. Se l'enzima di restrizione 
produce nel vettore estremità piatte (come EcoRV, mostrato in Fig. 2.5), qual- 
siasi frammento con estremità piatte potrà essere legato nel vettore tagliato. Esi- 
ste un certo numero di enzimi di restrizione che producono estremità piatte. I siti 
coesivi possono essere convertiti in piatti eliminando le estremità sporgenti con 
una nucleasi (ad esempio quella estratta da fagioli verdi; “mung bean”), o me- 
diante riempimento (filling in) dell’estremità sporgente con DNA polimerasi. Le 
reazioni di “filling in” sono spesso eseguite con il frammento Klenow della 
DNA polimerasi I in presenza dei nucleotidi richiesti. Per esempio, il “filling in” 
di estremità prodotte con EcoRI (Fig. 2.5) richiederà dATP e dTTP, e la stessa 
operazione per estremità originate da BamHI richiederà tutti e quattro i deossi- 
nucleosidi trifosfati. Il maggiore inconveniente del clonaggio con estremità 
piatte è rappresentato dalla scarsa efficienza della DNA ligasi nell’effettuare 
queste reazioni. 


e Utilizzare linker oligonucleotidici. Per unire ad esempio due frammenti di DNA 
che posseggono rispettivamente estremità EcoRI e PstI, è possibile sintetizzare 
una corta sequenza di DNA che permetta la loro riunione. Quindi, la DNA ligasi 
sarà in grado di saldare efficientemente le due estremità coesive non compatibili 
utilizzando il linker come ponte tra le due. 


Linker a singolo filamento: 


EcoRI Linker Pstl 
5°-G 5'AATTTGCA-3° G-3’ 
3'-CTTAA ACGTC-5’ 

DNA ligasi 


5°-GAATTTGCAG-3' 
3'-CTTAAACGTC-5” 
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Linker a doppio filamento: 


EcoRI Linker BamHi 
5/-G 5’-AATTAGATCA-3’ GATCC-3' 
3'-CTTAA 3'-TCTAGTCTAG-5’ G-5° 

DNA ligasi 


5°-GAATTAGATCAGATCC-3" 
3'-CTTAATCTAGTCATGG-5' 


e Mutagenesi per creare nuovi siti di restrizione. La sequenza del DNA può essere 
modificata per creare o annullare siti di restrizione. Si discuterà ulteriormente 
questo punto nel Capitolo 7. 


Dopo aver dimostrato la possibilità di costruire molecole di DNA ibride, il pro- 
blema successivo consisteva nella capacità di introdurle all’interno di cellule 
vive affinché il DNA potesse essere replicato e i geni contenuti potessero essere 
espressi. 


2.4 Trasformazione batterica 


Prima del 1970, erano stati effettuati parecchi tentativi per trasformare le cellule di 
E. coli con DNA esogeno. Tuttavia, in generale, si fecero pochi progressi. Ritor- 
nando all’esperimento di Griffith e collaboratori (Capitolo 1), è noto che la trasfor- 
mazione dei batteri avviene con DNA nudo, evento raro che si verifica con effi- 
cienza molto bassa. Inoltre, come è stato descritto precedentemente, i batteriofagi 
possono efficientemente infettare diversi ceppi di E. coli; però se lo stesso esperi- 
mento è effettuato con DNA nudo l’efficienza di trasformazione cala drastica- 
mente. Svariate ragioni spiegano questi risultati. 


(a) Introdurre il DNA nudo nelle cellule non è un problema banale. Il DNA è 
molto carico e non passa facilmente attraverso le membrane che circondano il 
batterio. Nei primi anni ‘70, tuttavia, furono messi a punto dei sistemi per ren- 
dere competenti le cellule di E. coli all’introduzione di DNA nudo; questi me- 
todi sono discussi di seguito. 


(b) Qual è il destino del DNA esogeno una volta entrato nella cellula? Il DNA 
esogeno, per essere mantenuto e replicato nel batterio, deve essere integrato nel 
cromosoma batterico (affinché possa successivamente essere replicato come 
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parte del cromosoma stesso), o essere replicato indipendentemente. Non è 
chiaro l’esatto meccanismo con cui avviene l’integrazione e normalmente rap- 
presenta un evento raro. Se il DNA esogeno non viene integrato, verrà probabil- 
mente perso durante la crescita cellulare. La ragione di questo comportamento è 
semplice: le molecole di DNA per essere replicate devono contenere un'origine 
di replicazione. I frammenti di DNA privi di tale struttura, anche se in grado di 
sopravvivere ai sistemi di restrizione batterici, saranno diluiti durante la replica- 
zione cellulare ed eventualmente persi. Anche se una molecola di DNA esogena 
contiene un'origine di replicazione, questa potrebbe non funzionare nella cellula 
batterica in cui tale DNA è stato introdotto. Se i frammenti di DNA non sono in 
grado di replicarsi indipendentemente, la soluzione più ovvia è di unirli ad un 
replicone idoneo. Questi repliconi sono noti come vettori o veicoli di clonaggio. 
I piccoli plasmidi e i batteriofagi sono i vettori più convenienti, in quanto repli- 
coni nel senso vero del termine. Infatti, il loro mantenimento nelle cellule non 
richiede necessariamente l’integrazione nel genoma dell’ospite e il loro DNA 
può essere facilmente isolato in forma integra. I differenti plasmidi e batterio- 
fagi utilizzati come vettori saranno descritti in dettaglio nel Capitolo 3. 


(c) Valutazione del processo di trasformazione. Assumendo di essere in grado di 
introdurre del DNA estraneo all’interno di una cellula batterica e che esso sia 
stabilmente mantenuto, come è possibile distinguere le cellule trasformate da 
quelle non trasformate? Anche se il DNA esogeno contiene un gene, le diffe- 
renze tra l’espressione genica procariotica e eucariotica (Capitolo 1) faranno sì 
che sia estremamente difficile che dei geni esogeni possano essere efficiente- 
mente trascritti e tradotti nelle cellule trasformate. Il problema può essere supe- 
rato inserendo il DNA esogeno in un vettore di clonaggio che contenga anche 
un marcatore di selezione espresso nelle cellule trasformate. I marcatori, nor- 
malmente geni per la resistenza agli antibiotici, saranno discussi in maggiore 
dettaglio nel Capitolo 3. 


Nel 1970 è stato scoperto che il trattamento delle cellule di E. coli con cloruro di 
calcio (CaCl,) permetteva l'assunzione di DNA di batteriofago nudo (Mandel e 
Higa, 1970). Successivamente si osservò che questa trasformazione chimica per- 
metteva anche, con livelli variabili di efficienza, l’ingresso dei plasmidi nelle cel- 
lule. L'aumento della efficienza di trasformazione si ottenne utilizzando impulsi 
elettrici ad alto voltaggio, un processo chiamato elettroporazione, e utilizzando il 
“gene gun”. Il processo della trasformazione permette l’introduzione di una mole- 
cola di DNA nella cellula ospite. Tutti i più comuni vettori plasmidici e virali (bat- 
teriofagi) utilizzati per clonare frammenti di DNA esogeno permettono l’inseri- 
mento di una singola molecola di vettore per cellula ospite. Questa molecola sin- 
gola può essere amplificata molte volte all’interno dell’ospite, ma tutte le mole- 
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cole risultanti saranno uguali. Di conseguenza, se una popolazione eterogenea di 
frammenti di DNA è legata in un vettore e trasformata per esempio in E. coli, 
ognuna delle risultanti colonie batteriche conterrà un solo tipo di molecola di 
DNA ricombinante. La popolazione eterogenea di frammenti di DNA viene sepa- 
rata in ciascuno dei suoi componenti durante i processi di trasformazione e di cre- 
scita cellulare. 


2.4.1 Trasformazione chimica 


La trasformazione chimica di E. coli è un processo semplice. In pratica, le cellule 
sono coltivate fino a metà della fase di crescita esponenziale (mid-log phase), rac- 
colte per centrifugazione e risospese in una soluzione di cloruro di calcio. Il DNA 
esogeno, normalmente contenuto in un plasmide, e le cellule ora competenti sono 
quindi incubati in ghiaccio e successivamente sottoposti ad un breve (30 sec) shock 
termico a 37-45°C. Viene quindi aggiunto del terreno di coltura e le cellule sono 
fatte crescere per una generazione allo scopo di permettere l’espressione delle carat- 
teristiche fenotipiche conferite dal plasmide (resistenza all’antibiotico). Infine, le 
cellule sono seminate in terreno selettivo in modo tale che solo le cellule che hanno 
introdotto il DNA esogeno saranno in grado di crescere. Il ruolo del cloruro di cal- 
cio in questo processo non è chiaro. Si pensa che alteri la parete batterica e potrebbe 
anche essere responsabile del legame del DNA sulla superficie cellulare. L’effettivo 
ingresso del DNA sembra essere stimolato dal breve shock termico (Fig. 2.10). 


Shock 
NUAINZA OE termico 


| pori 
si richiudono 


Palline ricoperte Le palline e il DNA 
di DNA si dissociano 


Figura 2.10. Tre metodi per trasformare le cellule. a) Trasformazione chimica. Il trattamento delle cel- 
lule con ioni calcio le rende competenti per l'introduzione del DNA. Il DNA può aderire alla superficie 
delle cellule e l'introduzione è favorita da brevi periodi di shock termico. b) Elettroporazione. Le cellule 
sono trattate con un impulso elettrico che favorisce la formazione dei pori. Il DNA può entrare nella 
cellula prima che i pori si richiudano spontaneamente. c) // “gene gun”. Le molecole di DNA legate a 
palline sono sparate sulle cellule dove raggiungono il citoplasma, e il DNA si dissocia dalle palline. 
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Poiché la trasformazione di E. coli rappresenta un passaggio essenziale di molti 
esperimenti di clonaggio, il processo deve essere il più efficiente possibile. L’effi- 
cienza della trasformazione è governata da una serie di fattori ospite-specifici e da 
altri fattori, ma i meccanismi molecolari con cui avviene non sono molto noti e le 
condizioni con cui ottenere un’efficiente trasformazione sono determinate in modo 
empirico. Le efficienze di trasformazione sono normalmente aumentate se: 


* le cellule batteriche da trasformare derivano da ceppi deficienti per il sistema di 
restrizione allo scopo di ridurre la probabilità di degradare il DNA esogeno; 


* alcune esonucleasi (ad esempio recBC) sono mutate nella cellula ospite di 
E. coli; 


* le cellule di £. coli competenti sono state trattate non solo con ioni calcio, ma an- 
che con altri cationi bivalenti (ad esempio rubidio e manganese) (Hanahan, 1983). 


La trasformazione chimica è applicabile alla maggior parte dei ceppi K12 di E. coli, 
con i quali si raggiungono efficienze di 10” — 10° trasformanti per microgrammo di 
DNA in funzione del particolare ceppo utilizzato (Liu e Rashidbaigi, 1990). 


2.4.2 Elettroporazione 


L’elettroporazione richiede l’uso di un campo elettrico per indurre microscopici 
pori all’interno della membrana biologica. I pori, definiti “elettropori”, permettono 
il passaggio di molecole, ioni e acqua da un lato all’altro della membrana. Dopo 
l'applicazione del campo elettrico, le cellule elettroporate sono in grado di richiu- 
dere spontaneamente i pori e continuare la crescita. La formazione dei pori è un 
evento estremamente rapido (approssimativamente 1 us), mentre la loro chiusura è 
molto più lenta, richiedendo alcuni minuti. L'uso dell’elettroporazione per trasfor- 
mare le cellule batteriche e quelle degli eucarioti superiori è diventato molto popo- 
lare negli anni ottanta. Il meccanismo non è ben conosciuto e quindi, in analogia 
con la trasformazione chimica, la messa a punto di protocolli per particolari appli- 
cazioni è stata normalmente effettuata in modo empirico, variando i parametri del 
campo elettrico (ampiezza, durata, numero e intervalli tra gli impulsi elettrici) (Ho 
e Mittal, 1996; Canatella et a/., 2001). 

La formazione degli elettropori sembra essere influenzata da due fattori princi- 
pali: il tipo di cellule utilizzate e la durata e l'ampiezza dell’impulso elettrico ap- 
plicato. Certi tipi cellulari rispondono bene a questo trattamento, mentre altri sono 
più refrattari. Tuttavia, in generale, la maggior parte delle cellule dopo elettropora- 
zione introduce il DNA con efficienza variabile. Come detto precedentemente, la 
durata e l'ampiezza dell’impulso sono critici per ogni tipo cellulare. La formazione 
dei pori si osserva quando il prodotto tra l'ampiezza dell’impulso e la sua durata è 
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appena al di sopra di una soglia limite, oltre la quale il numero dei pori e il loro 
diametro aumenta in funzione del prodotto tra ampiezza e durata. Quando utiliz- 
zando grandi ampiezze e lunghe durate si raggiunge una soglia limite superiore, il 
diametro dei pori e quindi l’area totale dei pori risulterà troppo ampia per permet- 
tere la loro riparazione. In queste situazioni la cellula è danneggiata in modo irre- 
versibile. Durante l’elettroporazione, il campo elettrico provoca il passaggio di un 
flusso di corrente attraverso le cellule. I tamponi e i terreni di coltura contengono 
ioni (come il sodio) a concentrazioni sufficientemente alte da favorire il passaggio 
di correnti elettriche elevate, in grado di provocare un notevole riscaldamento delle 
cellule, che può portare alla loro morte. Tale effetto deve quindi essere ridotto uti- 
lizzando un’ampiezza relativamente alta, impulsi di breve durata o due impulsi di 
durata molto breve (Sukharev er a/., 1992). Inoltre, le cellule da elettroporare sono 
lavate ripetutamente in acqua distillata per rimuovere qualsiasi traccia di sali che 
potrebbero funzionare da effetto scatenante del passaggio dell'impulso. 


2.4.3 Gene gun 


Il “gene gun” è un’apparecchiatura che permette letteralmente di “sparare” il DNA 
in cellule bersaglio (Johnston e Tang, 1994). Il DNA da introdurre nelle cellule è 
utilizzato per ricoprire microscopiche palline di oro o tungsteno. Le palline rico- 
perte sono quindi attaccate al termine di una pallottola di plastica che viene posta 
nella camera di sparo del “gene gun”. Uno scoppio dirige la pallottola lungo una 
canna verso le cellule bersaglio posizionate appena dopo il termine della canna 
stessa. AI termine della canna, la pallottola viene fermata, ma le palline ricoperte di 
DNA continuano il loro tragitto verso le cellule. Alcune palline attraversano la pa- 
rete cellulare e raggiungono il citoplasma cellulare, dove si dissociano dal DNA 
che trasforma così le cellule. Il “gene gun” è particolarmente utile per trasfor- 
mare cellule refrattarie agli altri metodi, come ad esempio quelle vegetali. Inol- 
tre, il sistema è sempre più utilizzato per trasferire costrutti di DNA in animali in 
toto. Per esempio, è stato sviluppato un vaccino contro l’afta epizootica, un’infe- 
zione virale molto aggressiva negli animali da allevamento. Il vaccino è costi- 
tuito da parecchi geni virali che espressi nel maiale forniscono resistenza all’in- 
fezione (Benvenisti et al., 2001). 


2.5 Gel elettroforesi 


L'andamento dei primi esperimenti di taglio e riunione di molecole di DNA è stato 
valutato utilizzando la velocità di sedimentazione in gradiente di saccarosio. Que- 
sta tecnica, che si basa sulla separazione in funzione della sola dimensione dopo 
prolungata centrifugazione in una provetta contenente elevate concentrazioni di 
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saccarosio, necessita di elevate quantità di DNA ed è incapace di distinguere pic- 
cole differenze nella dimensione delle molecole. Per valutare in modo più accurato 
gli esperimenti di ingegneria genetica erano quindi necessari dei metodi che richie- 
devano meno materiale e che fornivano un elevato grado di separazione. Come 
detto precedentemente, il DNA è una molecola molto carica. I fosfati che costitui- 
scono lo scheletro zucchero-fosfato di ogni filamento di DNA forniscono un ele- 
vato livello di cariche negative. Un piccolo frammento di DNA conterrà meno cari- 
che negative di un frammento più grande, in quanto il primo contiene meno fosfati. 
Tuttavia, la carica totale per unità di lunghezza sarà la medesima per entrambi i 
frammenti di DNA corto e lungo. Di conseguenza se si applica una corrente elet- 
trica a campioni di DNA di diversa dimensione, assumendo che l’attrito sia trascu- 
rabile, questi si muoveranno con la stessa velocità verso il polo positivo (anodo). 
Di conseguenza, un meccanismo per permettere la separazione delle molecole do- 
vrebbe essere quello di aumentare l’attrito in modo tale che quelle più piccole si 
muovano più velocemente verso l’anodo, rispetto alle molecole di dimensione 
maggiore. Il movimento dei frammenti di DNA attraverso un gel può fornire l’at- 
trito necessario per separare molecole di differente lunghezza. 


2.5.1 Gel di poliacrilamide 


L’elettroforesi in gel di poliacrilamide (PAGE) è stata introdotta nel 1959 come 
metodo per separare le proteine (Raymond e Wientraub, 1959). Tuttavia, la tecnica 
è ugualmente utilizzabile per la separazione degli acidi nucleici. La dimensione dei 
pori di un gel di questo tipo può variare in funzione della percentuale di poliacrila- 
mide (dal 3 al 30%) utilizzata per preparare il gel. Questo permette di separare mo- 
lecole di diversa dimensione. PAGE è una tecnica molto efficiente per l’analisi 
delle molecole di DNA, in quanto è in grado di separare molecole che differiscono 
anche per una sola coppia di basi. L’elevato livello di risoluzione rende il metodo 
ideale per il sequenziamento del DNA. Tuttavia, la tecnica è limitata all'analisi di 
molecole di DNA relativamente piccole (meno di 1000 bp). Molecole di DNA più 
lunghe non riescono ad entrare nei pori della poliacrilamide e di conseguenza non 
vengono separate. Poiché la maggior parte dei vettori utilizzati normalmente per il 
clonaggio dei geni ha una dimensione maggiore di quella separabile con PAGE si è 
sentita le necessità di avere a disposizione un metodo alternativo. 


2.5.2 Gel di agarosio 


L’agarosio è un colloide estratto da un’alga. È un polisaccaride lineare costituito da 
unità di base ripetute di agarobiosio, che comprende unità alternate di galattosio e 
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3,6-anidrogalattosio. I gel di agarosio si preparano sospendendo la polvere di aga- 
rosio, a concentrazioni variabili dall’ 1 al 3%, in un tampone acquoso e quindi bol- 
lendo fino a formare una soluzione limpida. Questa viene poi versata in uno 
stampo per gel, che contiene un pettine per creare dei pozzetti, e lasciata raffred- 
dare a temperatura ambiente per formare un gel (Fig. 2.11). Dopo la formazione 
del gel, si rimuove il pettine e i campioni di DNA possono essere caricati nei poz- 
zetti ottenuti. Il gel è quindi sottoposto ad un campo elettrico costante (di circa 10 
V/cm) e il DNA migrerà nel gel verso l’elettrodo positivo (anodo). 

La risoluzione di un gel di agarosio è inferiore rispetto a quella ottenuta con 
il PAGE. Le bande che si formano in un gel di agarosio sono abbastanza diffuse 
in quanto il diametro dei pori non può essere accuratamente controllato. Un gel 
all’1% contiene una grande varietà di dimensione di pori, mentre quello al 2% 
contiene in media pori più piccoli però ancora con dimensioni molto variabili. 
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Figura 2.11. Gel elettroforesi in agarosio. L’agarosio disciolto è colato in uno stampo per gel che 
contiene un pettine. Dopo che il gel si è formato, il pettine è rimosso per creare i pozzetti nei quali 
saranno caricati i campioni di DNA. Si applica quindi una corrente elettrica per spostare il DNA 
carico negativamente verso l'elettrodo positivo. Le piccole molecole di DNA generalmente migrano 
attraverso il gel con una velocità superiore rispetto a quelle più grosse. 
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Una volta che i frammenti di DNA sono stati separati mediante il gel di agarosio, 
per poterli visualizzare devono essere colorati. Il metodo più comune implica 
l'immersione del gel in una soluzione di etidio bromuro, una molecola planare in 
grado di intercalarsi tra le coppie di basi impilate del DNA (Fig. 2.12). Il legame 
dell’etidio bromuro al DNA provoca una distorsione della struttura a doppia elica 
ed uno srotolamento localizzato. Il bromuro di etidio lega meglio il DNA a dop- 
pio filamento rispetto a quello a singolo filamento e all’RNA, a causa dell’infe- 
riore impilamento delle basi azotate. L’immersione di un gel di agarosio conte- 
nente DNA in etidio bromuro provocherà la concentrazione del composto chi- 
mico all’interno del DNA. L'illuminazione con luce UV (lunghezza d’onda 260- 
300 nm) del gel così trattato, provoca la fluorescenza dell’etidio bromuro, che 
permette all’interno del gel la visualizzazione del DNA come una banda di fluo- 
rescenza. 

Come visto precedentemente, la carica del DNA per unità di lunghezza è co- 
stante, e in un gel ci si dovrebbe attendere che l’attrito aumenti proporzional- 
mente all’aumentare della lunghezza del DNA. Un frammento di 2.000 bp do- 
vrebbe mostrare un attrito doppio rispetto a quello di un frammento di 1.000 bp. 
Di conseguenza ci deve essere una relazione inversa tra la massa del DNA e la sua 


Etidio bromuro 


Figura 2.12. Il legame dell’etidio bromuro al DNA. L'etidio bromuro è una molecola planare in grado 
di intercalarsi tra le basi impilate della doppia elica del DNA. Il legame distorce la doppia elica ed au- 
menta la sua lunghezza. Il DNA a cui è legato l’etidio bromuro emette fluorescenza se è illuminato 
con luce ultravioletta. 
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velocità di migrazione attraverso il gel. Utilizzando i gel di agarosio si ottengono 
ottime separazioni di molecole di DNA comprese nell’intervallo 200-15.000 bp. 
Due fattori principali regolano la velocità con cui un frammento di DNA migrerà 
attraverso un gel applicando una corrente costante: la sua massa molecolare (lun- 
ghezza) e la sua struttura tridimensionale (forma). In generale, frammenti di DNA 
piccoli migreranno più velocemente attraverso il gel rispetto a frammenti più lun- 
ghi (Fig. 2.13(a)). Tuttavia, se si analizza attentamente la modalità di migrazione 
dei frammenti di DNA a lunghezza nota, possiamo osservare che non esiste una 


precisa correlazione inversa tra la lunghezza del frammento e la migrazione (Fig. 
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Figura 2.13. Migrazione dei frammenti di DNA attraverso un gel di agarosio. (a) Un gel di agarosio 
che mostra la separazione di frammenti di DNA a dimensione nota. (b) La dimensione di un fram- 
mento di DNA e la sua distanza di migrazione nel gel. (c) Grafico della relazione tra la dimensione 
dei frammenti e la distanza di migrazione costruito con in risultati mostrati in (b), che mostra come la 
relazione tra distanza di migrazione e lunghezza dei frammenti non sia lineare. (d) Grafico della rela- 
zione tra il log della dimensione dei frammenti e la distanza di migrazione, che mostra l’esistenza di 
una precisa correlazione inversa tra i due parametri. 
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Se misuriamo la distanza che le molecole di DNA di lunghezza nota hanno 
percorso attraversando un gel di agarosio e mettiamo in un grafico la dimensione 
della molecole contro la distanza di migrazione possiamo osservare che la distanza 
di migrazione è inversamente proporzionale al log della dimensione (Fig. 2.13(d)). 
Questo effetto è più facilmente osservabile analizzando la distanza di migrazione 
dal pozzetto di particolari frammenti di DNA dopo elettroforesi. Frammenti di 
DNA di 500 e 1.000 bp sono ben separati nel gel, mentre i frammenti di 8.000 e 
10.000 bp migrano vicini l’uno all’altro (Fig. 2.13(a)). La conseguenza della corre- 
lazione inversa con il log della dimensione è che ogni frammento di DNA di circa 
30 kb migrerà in un gel di agarosio nella stessa posizione raggiunta da frammenti 
più grandi. Come conseguenza i frammenti di DNA molto grossi non potranno se- 
pararsi l’uno dall’altro, e quindi i gel di agarosio non sono in grado di risolvere 
molecole molto grosse. In un gel di agarosio, un frammento di DNA di 30 kb mi- 
grerà nella stessa posizione di uno di 60 kb. Entrambi i frammenti sono in grado di 
entrare nei pori del gel e attraversarli guidati dalla corrente elettrica, ma non si ot- 
tiene la loro separazione. La separazione di tali frammenti non può essere ottenuta 
nemmeno utilizzando gel più lunghi, o abbassando la concentrazione dell’agarosio 
nel gel. Per capire questo fenomeno è importante sapere in che modo i frammenti 
effettivamente attraversano i pori di un gel. 

Il DNA è un polimero molto carico, lungo e stretto. Per muoversi attraverso un 
gel, il DNA tende a fare il cammino che presenta minor resistenza e quindi si 
muove facendo entrare nei pori una delle estremità (Fig. 2.14). Diversi modelli teo- 
rici sono stati proposti per spiegare il movimento del DNA attraverso i gel (Slater, 
Mayer e Drouin, 1996). Forse il modo più semplice è di immaginare che una mo- 
lecola di DNA molto flessibile possa attraversare i pori con un movimento stri- 
sciante simile a quello dei serpenti (Fig. 2.15). I piccoli frammenti di DNA, come 
conseguenza dell’effetto setaccio procurato dai pori, saranno in grado di attraver- 
sare i pori stessi più facilmente rispetto a molecole più lunghe. Tuttavia, molecole 
di DNA più lunghe che si muovono in questo modo potranno essere intrappolate 0 
aggrovigliate all’interno del gel, e saranno quindi più ritardate rispetto a quanto 
atteso in base alla sola dimensione. I frammenti di DNA attorno alle 30 kb sem- 
brano aggrovigliarsi in modo tale da inibire il movimento strisciante attraverso i 
pori del gel. 

Il secondo fattore importante che influenza la migrazione attraverso un gel è 
la forma o struttura di un particolare frammento di DNA. Per esempio, il DNA 
plasmidico isolato dalle cellule di E. coli è sempre costituito da molecole circolari 
superavvolte negativamente. Queste sono strutture abbastanza compatte che mi- 
grano velocemente attraverso un gel di agarosio (Fig. 2.16). Se un filamento del 
DNA plasmidico si rompe si perderà il superavvolgimento, e la struttura più 
aperta e rilassata che si forma migrerà più lentamente attraverso il gel. Se lo 
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Figura 2.14. Si pensa che il DNA migri attraverso i pori di un gel con un meccanismo che prevede 
l'ingresso iniziale di una delle estremità. Se pensiamo che un gel di agarosio sia una rete di pori, 
possiamo immaginare che il DNA possa più facilmente attraversare i pori se si muove perpendicolar- 
mente, piuttosto che orizzontalmente. Questo movimento perpendicolare è a volte riferito come 
serpeggiante. 
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Figura 2.15. Il movimento serpeggiante del DNA attraverso i pori di un gel. Le molecole di DNA che 
si muovono attraverso i pori possono essere intrappolate in modi diversi. Le molecole più grandi 
sono più facilmente intrappolate rispetto a quelle piccole. Questo potrebbe essere il motivo per cui, in 
un gel di agarosio convenzionale, le molecole più grandi di 30 kb migrano tutte circa nella stessa po- 
sizione. 


stesso plasmide è trattato con un enzima di restrizione che taglia al suo interno 
una sola volta, il DNA linearizzato migrerà in posizione intermedia tra il superav- 
volto e le molecole con un nick. Quindi, in un gel di agarosio molecole di DNA 
della stessa dimensione possono migrare in posizioni differenti che dipendono 
dalla forma del DNA. 
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Figura 2.16. Effetto della forma sulla migrazione dei frammenti di DNA. Tre frammenti di DNA, 
ognuno contenente esattamente lo stesso numero di coppie di basi e la stessa sequenza, possono 
migrare differentemente in un gel di agarosio. Il DNA superavvolto è molto compatto e migra rapida- 
mente attraverso un gel. Se anche solo un filamento del DNA superavvolto viene interrotto tramite la 
rottura di un legame fosfodiesterico, la molecola assume una struttura aperta caratterizzata da bassa 
velocità di migrazione. Il DNA lineare, in cui i legami fosfodiesterici sono rotti in entrambi i filamenti, 
migra con mobilità intermedia tra il superavvolto e quello aperto. 


+ 


2.5.3 Gel elettroforesi in campo pulsato 


Come visto precedentemente, i frammenti di DNA superiori alle 30 kb migreranno 
con la stessa mobilità, indipendentemente dalla dimensione. Questo fenomeno si vi- 
sualizza in un gel come una banda larga e diffusa. Per superare il problema della li- 
mitazione della risoluzione dovuta alla lunghezza delle molecole, Schwartz e Cantor 
introdussero l’elettroforesi in campo pulsato (PFGE) come metodo per separare mo- 
lecole di DNA molto lunghe (Schwartz e Cantor, 1984). Piuttosto che far migrare le 
molecole in un campo elettrico statico, modificarono la direzione della corrente elet- 
trica per alterare il cammino delle molecole di DNA, man mano che si muovono al- 
l’interno del gel (Fig. 2.17). Utilizzando questo metodo, il limite superiore di separa- 
zione in gel di agarosio è stato innalzato da 30-50 kb a più di 10 Mb (10.000 kb). 

Se durante l’elettroforesi, il DNA è forzato a cambiare direzione, dalla banda 
larga e diffusa iniziano a separarsi frammenti con differente dimensione. Probabil- 
mente, il cambiamento di direzione inibisce o riduce la formazione di grovigli. Ad 
ogni orientamento del campo elettrico, rispetto al gel, i frammenti di DNA più pic- 
coli inizieranno a muoversi nella nuova direzione più velocemente di quelli più 
grossi. Quindi, il DNA più grosso resta indietro, permettendo la sua separazione 
dai frammenti piccoli. Il sistema originale di campo pulsato utilizzava campi elet- 
trici discontinui generati da elettrodi statici. Come conseguenza, il DNA non po- 
teva migrare in modo lineare e questo complicava l’interpretazione dei risultati. 
Idealmente, per semplificare la comparazione tra le singole migrazioni, il DNA do- 
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Figura 2.17. Gel elettroforesi in campo pulsato (PFGE). (a) La variazione del campo elettrico 
durante la PFGE. La corrente è applicata al gel per un periodo definito (il periodo dell'impulso) che 
è spesso nell'ordine di 0,5-2 min. Dopo questo tempo, si cambia la direzione del campo elettrico. 
(b) Il cambiamento ripetuto del campo induce il DNA a spostarsi lungo il gel con un movimento a 
zig-zag. Per cambiare la direzione del DNA durante l’elettroforesi, la PFGE originale utilizzava due 
campi elettrici non omogenei (Schwartz e Cantor, 1984). Il movimento a zig-zag ha permesso la se- 
parazione di grosse molecole di DNA, ma l’utilizzo allo stesso tempo di campi elettrici non omogenei 
ha originato la formazione di bande di migrazione curvate. (c) L'utilizzo di campi elettrici omogenei 
permette di ottenere quadri di migrazione lineari come quelli mostrati, che si riferiscono ad interi cro- 
mosomi di lievito. 


vrebbe separarsi in modo lineare. L'approccio più semplice per ottenere linee di 
migrazione diritte è definito gel elettroforesi in campo invertito (FIGE), che uti- 
lizza elettrodi paralleli per garantire un campo elettrico omogeneo. La FIGE lavora 
mediante l’inversione periodica della polarità degli elettrodi durante l’elettroforesi. 
Poiché la FIGE sottopone il DNA ad un ri-orientamento di 180°, il DNA impiega 
del tempo per muoversi a ritroso. L'angolo di riorientamento della FIGE produce 
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una separazione efficiente al di sotto delle 2.000 kb. Inoltre la FIGE presenta una 
inversione di mobilità, in quanto il DNA più grosso si muove davanti a quello più 
piccolo. L'uso di campi elettrici omogenei insieme alla PFGE permette anche una 
migrazione lineare del DNA. Per esempio, l’elettroforesi in campo elettrico omo- 
geneo a contorno bloccato (contour-clamped) (CHEF) ri-orienta il DNA con angoli 
obliqui più piccoli, generalmente tra 96 e 120°. Questo causa un movimento a zig- 
zag del DNA verso la parte inferiore del gel, garantendo comunque una migrazione 
lineare (Fig. 2.18). 

Durante la PFGE, parecchi parametri influenzano simultaneamente l’effettivo 
ambito di separazione di un particolare gel. Questi includono il tipo e la concentra- 
zione dell’agarosio, la composizione e la temperatura del tampone, la forza del 
campo elettrico, l’angolo di ri-orientamento, ecc. Tuttavia, la durata dell’impulso 
è essenzialmente responsabile dell’effettivo ambito di separazione. La durata del- 
l’impulso rappresenta il tempo di ognuno dei campi elettrici alternati. Tempi brevi 
portano alla separazione di molecole di DNA più piccole in quanto questi fram- 
menti dopo riorientamento inizieranno a muoversi più velocemente rispetto a quelli 
di dimensioni maggiori. Similmente, tempi lunghi porteranno alla separazione di 
molecole di DNA più grandi (Fig. 2.19). 

La disponibilità della PFGE permette di separare facilmente in un gel molecole 
di DNA che rappresentano interi cromosomi. Molecole di DNA molto lunghe come 
queste sono facilmente frammentabili e anche, in relazione alla loro elevata visco- 
sità, difficilmente pipettabili. Quindi è ovvia la necessità di disporre per l’elettrofo- 
resi di materiale integro. Il tentativo di frazionare molecole parzialmente degradate 
o tronche provocherà la formazione di bande diffuse, con conseguente difficoltà nel- 
l’interpretazione dei risultati. La soluzione al problema è rappresentata dalla iniziale 
immersione delle cellule intatte in blocchetti di agarosio, che vengono quindi trattati 


FIGE 


Figura 2.18. | due tipi principali di PFGE. L’elettroforesi su gel a inversione di campo (FIGE) si ottiene 
quando la corrente è invertita continuamente di 180° rispetto alla direzione di migrazione del DNA. 
L'elettroforesi in campo elettrico omogeneo a contorno bloccato (contour-clamped) (CHEF) impiega 
elettrodi multipli in modo tale che la direzione del campo elettrico possa essere accuratamente variata. 
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Figura 2.19. L'effetto della durata dell'impulso sulla separazione di frammenti di DNA di differente di- 
mensione. | cromosomi del lievito Saccharomyces cerevisiae e un insieme di marcatori di DNA a 
peso molecolare noto sono stati sottoposti a PFGE in condizioni generali uguali eccetto per la durata 
dell'impulso. Da notare che l'aumento della durata dell'impulso origina separazioni migliori dei grossi 
frammenti di DNA. La dimensione dei marcatori è indicata in kb. Riprodotto da Wrestler et a/. (1996), 
con l’autorizzazione di Bruce Birren (Whitehead Institute). 


con enzimi per digerire la membrana cellulare e le proteine per ottenere all’interno 
dell’agarosio una preparazione di DNA nudo e intatto. I blocchetti sono quindi rita- 
gliati nella dimensione corretta per essere posti all’interno dei pozzetti e precedente- 
mente trattati, se necessario, con enzimi di restrizione (Fig. 2.20). 


2.6 Blotting degli acidi nucleici 


Quando si analizzano dei frammenti di DNA all’interno di un gel colorato con etidio 
bromuro sembrano, con l’eccezione della dimensione, tutti identici (Fig. 2.13(a)). 
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Figura 2.20. Preparazione di DNA ad elevato peso molecolare per l’analisi con PFGE. Le cellule in- 
tegre sono mescolate con agarosio disciolto, ma a bassa temperatura, ed il tutto è posto in stampi 
per blocchetti. Dopo la solidificazione, i blocchetti possono essere trattati con enzimi idrolitici per 
lisare la parete cellulare e rilasciare il DNA cromosomale. Se è necessario, il DNA ancora nei bloc- 
chetti di agarosio può essere digerito con enzimi di restrizione. | blocchetti trattati sono quindi posti 
nei pozzetti di un gel di agarosio per la PFGE. 


Tuttavia è noto che la sequenza del DNA presente in una banda è differente da 
quella delle altre bande. Anche le bande che mostrano la stessa dimensione pos- 
sono contenere sequenze di DNA molto diverse. Naturalmente è la stessa sequenza 
del DNA che svolge un ruolo essenziale per la funzione di una molecola. Verso la 
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metà degli anni ‘70 sono stati sviluppati dei metodi per distinguere all’interno di 
un gel bande caratterizzate da una particolare sequenza di DNA. Questi metodi si 
basano sull’ibridazione degli acidi nucleici allo scopo di evidenziare la presenza di 
sequenze complementari. Il metodo originale del blotting fu sviluppato da Ed 
Southern nel 1975 per rivelare all’interno di un gel frammenti di DNA comple- 
mentari ad una determinata sequenza di acido nucleico (Southern, 1975). 


2.6.1 Southern blotting 


Il metodo conosciuto come Southern blotting implica che i frammenti di DNA 
frazionati per elettroforesi in un gel di agarosio siano trasferiti ed immobilizzati su 
una membrana. Dopo il frazionamento su gel, i frammenti di DNA sono denaturati 
(separazione dei due filamenti) utilizzando una soluzione alcalina. La presenza 
sulla membrana di DNA a singolo filamento è importante per permettere alle se- 
quenze complementari di legarsi al DNA immobilizzato. Dopo la denaturazione 
del DNA all’interno del gel, i frammenti sono trasferiti su di una membrana. Il pro- 
cesso di trasferimento può essere effettuato sia elettroforeticamente, sia per capilla- 
rità. Il secondo sistema comporta che il gel sia messo direttamente a contatto con 
la membrana e che una soluzione tampone passi attraverso il gel fino alla mem- 
brana. I frammenti di DNA sono trascinati dal movimento del tampone e passano 
dal gel alla membrana dove rimangono intrappolati. Inizialmente furono utilizzate 
membrane di nitrocellulosa che, essendo piuttosto fragili, solo oggi sono state so- 
stituite da membrane di nylon. Dopo il trasferimento, i frammenti di DNA devono 
essere fissati alla membrana per impedirne il distacco. Il fissaggio può essere effet- 
tuato in vari modi, incluso il riscaldamento a 80°C e il trattamento con raggi UV 
per la formazione di legami crociati tra alcune T del DNA ed i gruppi carichi posi- 
tivamente presenti sulla membrana. Dopo la fissazione, la membrana è posta in una 
soluzione contenente un acido nucleico a singolo filamento (DNA o RNA) spesso 
marcato con isotopi radioattivi. L'acido nucleico marcato (sonda) è quindi messo 
nelle condizioni di ibridare con le sequenze complementari presenti sulla mem- 
brana. Le interazioni tra la sonda e la sua sequenza complementare porterà al le- 
game della sonda alla membrana mediante la formazione di legami idrogeno che 
permettono la formazione di una doppia elica. La membrana è quindi lavata abbon- 
dantemente per rimuovere la sonda legata aspecificamente: il prodotto dell’ibrida- 
zione (interazioni specifiche) è rivelato tramite esposizione della membrana ad una 
lastra fotografica per raggi X (Fig. 2.21). 

Il Southern blotting è utilizzato per individuare sequenze di DNA identiche o 
anche simili a quelle della sonda. L’ibridazione della sonda alle sequenze di DNA 
intrappolate sul filtro è la fase critica del processo. Come visto precedentemente, il 
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Figura 2.21. Southern blotting. | frammenti di DNA separati in elettroforesi su gel di agarosio sono 
trasferiti su una membrana dopo essere stati denaturati a singolo filamento. La membrana è poi 
messa a contatto con una sonda marcata. ll legame della sonda alla membrana, mediante la forma- 
zione di legami idrogeno, può essere rivelato mediante esposizione ad una lastra per raggi X. La 
sonda radioattiva formerà sulla membrana una banda nella posizione corrispondente alle sequenze 
complementari alla sonda. 


DNA a singolo filamento non si legherà con elevata affinità solo alla sua sequenza 
complementare, ma potrà anche legarsi con affinità ridotta a sequenze simili. Il le- 
game differenziale a diverse sequenze di DNA può essere utilizzato per identifi- 
care molecole non uguali, ma solo correlate alla sonda. Questo tipo di analisi può 
essere effettuato variando la temperatura o la concentrazione salina dei lavaggi 
dopo l’ibridazione (Fig. 2.22). Il lavaggio della membrana ad elevate temperature 
(alta stringenza) provocherà la dissociazione della maggior parte delle sequenze le- 
gate in modo relativamente specifico. Di conseguenza, le bande che si osserve- 
ranno dopo l’esposizione alla lastra fotografica corrispondono a molecole identiche 
o molto simili alla sonda utilizzata. Il lavaggio a temperature inferiori 
riduce il livello generale di stringenza e le sequenze meno correlate alla sonda ri- 
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Figura 2.22. Il lavaggio a differenti temperature (stringenza) delle membrane ibridate in Southern 
blot produce risultati differenti. Il lavaggio ad alte temperature rimuove tutte le molecole della sonda 
ad eccezione di quelle legate con maggiore forza (che identificano sul filtro le sequenze più simili o 
uguali a quella della sonda). | lavaggi a temperature inferiori possono permettere di rivelare sulla 
membrana le sequenze che sono simili, ma non identiche, alla sequenza della sonda. L’effettiva 
temperatura a cui si effettuano i lavaggi dipenderà dalla lunghezza della sonda e dalla probabilità 
che essa trovi sulla membrana una sequenza perfettamente complementare. 


marranno sul filtro e origineranno segnali positivi sulla lastra per raggi X. Questo 
approccio è molto utile quando non si conosce esattamente la sequenza del gene 
che si intende identificare, come quando si conosce la sequenza aminoacidica di 
una proteina, ma non quella nucleotidica che la codifica. Questo aspetto sarà ulte- 
riormente affrontato nel Capitolo 6. 


2.6.2 Differenti applicazioni del blotting 


Dopo l’iniziale descrizione del Southern blotting e dell’ibridazione, sono state ri- 
portate diverse varianti della metodica che prevedono tutte il trasferimento di mate- 
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riale da un gel ad una membrana e il successivo specifico rivelamento di particolari 
molecole. A queste tecniche sono stati assegnati nomi che riflettono i punti cardi- 
nali piuttosto che la descrizione della loro finalità. 


e Northern blotting — il rivelamento di sequenze di RNA utilizzando delle sonde 
(Thomas, 1980). L’RNA è frazionato in un gel di agarosio e trasferito su una 
membrana, come descritto precedentemente con l’aggiunta di piccole varianti. 
Le specifiche sequenze di RNA sono quindi rivelate mediante ibridazione utiliz- 
zando DNA a singolo filamento o RNA complementare. 


* Western blotting — il rivelamento di specifiche proteine utilizzando anticorpi 
(Burnette, 1981). Le proteine sono separate mediante un gel di poliacrilamide 
che contiene SDS per mantenerle srotolate (denaturate). Le proteine sono tra- 
sferite dal gel ad una membrana come descritto precedentemente per il Southern 
blot (elettroblot). Particolari proteine sono quindi messe in evidenza con anti- 
corpi. La specifica interazione tra l’anticorpo e il suo antigene avviene sulla 
membrana e quindi si rivela la posizione dell’anticorpo legato. Inizialmente 
sono stati utilizzati anticorpi marcati con sostanze radioattive che sono stati poi 
sostituiti dall’utilizzo di “sandwiches” di anticorpi. Il principio del sandwich si 
basa sul legame all’antigene presente sulla membrana da parte di un anticorpo 
non marcato (anticorpo primario). Un secondo anticorpo marcato (anticorpo se- 
condario) viene quindi usato per mettere in evidenza la presenza del primo anti- 
corpo. Il sistema dell’anticorpo secondario offre diversi vantaggi: un aumento 
della sensibilità del sistema dovuta alla natura bivalente del legame anticorpale e 
la possibilità con un singolo anticorpo secondario di rivelare differenti anticorpi 
primari. Per esempio, gli anticorpi primari sono spesso prodotti nel topo. Un an- 
ticorpo secondario contro gli anticorpi di topo, prodotto per esempio nel coni- 
glio, sarà in grado di interagire con differenti anticorpi primari prodotti in topo 
(Fig. 2.23). 


* South-Western blotting — l’identificazione di proteine che si legano a particolari 
sequenze di DNA (Singh et al., 1988). Le proteine possono essere prima frazio- 
nate su gel, oppure direttamente caricate su una membrana che viene successiva- 

mente incubata con un corto DNA a doppio filamento marcato. Se la proteina è 
Ù capace di legare il DNA verrà rivelata dalla presenza della marcatura. 


i 2.7 Purificazione del DNA 


Molte delle tecniche descritte in questo capitolo si basano sulla disponibilità di no- 
tevoli quantità di DNA purificato. L’isolamento del materiale genetico dalle cellule 
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Figura 2.23. Utilizzo di anticorpi in western blotting per rilevare specifiche proteine. Le proteine sono 
frazionate con un gel di poliacrilamide, che normalmente contiene SDS per mantenerle in uno stato 
denaturato e sono quindi trasferite su di una membrana di nitrocellulosa. Prima dell'aggiunta dell’an- 
ticorpo primario, i siti di legame aspecifici delle proteine presenti sulla membrana sono bloccati con 
l'aggiunta di polvere di latte in soluzione. L’'anticorpo primario si legherà specificamente all’antigene 
contro cui è stato prodotto. Per evidenziare la localizzazione dell’anticorpo primario, si aggiunge 
quindi un anticorpo secondario marcato. Il sandwich di anticorpi permette un’amplificazione del se- 
gnale. L’anticorpo secondario è spesso marcato con un enzima la cui attività, in presenza di substrati 
appropriati, provoca un cambiamento di colore sulla membrana o l'emissione di luce che può essere 
rivelata con una lastra per raggi X. cd 


è un metodo relativamente semplice. La lisi della parete cellulare provoca la fuo- 
riuscita del DNA che però è contaminato da RNA e proteine. Vi è quindi la neces- 
sità di disporre di metodi per rimuovere i contaminanti al fine di ottenere una pre- 
parazione di DNA purificato. 
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L’isolamento del DNA genomico dalle cellule si effettua molto spesso in ac- 
cordo con la seguente procedura. 


e Si lisa la parete cellulare con metodi che variano a seconda del tipo di cellula. 
Per esempio, le cellule batteriche sono spesso trattate con l’enzima lisozima per 
distruggerne la parete prima della lisi con un detergente. Per la parete delle cel- 
lule di lievito, invece, si utilizza la zimolasi e quindi si effettua la lisi, spesso per 
frantumazione con palline di vetro. 


e Si rimuovono i frammenti cellulari per centrifugazione. 


e Il materiale solubile rimasto è quindi emulsionato con fenolo per rimuovere le 
proteine mediante la loro denaturazione. Spesso si usa il cloroformio insieme a 
fenolo (soluzione fenolo-cloroformio) in quanto anch’esso è un denaturante 
delle proteine, oltre a svolgere la funzione di stabilizzante dell’interfaccia tra la 


fase acquosa e quella fenolica. 


e Gli acidi nucleici contenuti nella fase acquosa possono essere precipitati con 
etanolo. Il DNA precipitato, di aspetto flocculare, può essere raccolto per centri- 
fugazione. 


e Si può rimuovere Il’ RNA mediante trattamento con RNasi. 


Per molte applicazioni, il DNA deve essere ulteriormente purificato. Per questa 
finalità può essere utilizzata la centrifugazione in gradiente di densità all’e- 
quilibrio; il metodo è anche utile per separare differenti tipi di molecole di 
DNA. Il campione di DNA è normalmente mescolato con una soluzione di CsCl 
(cloruro di cesio), sale in grado di formare un gradiente di densità in seguito a 
centrifugazione. Nel gradiente le molecole di DNA si posizioneranno nel punto 
che corrisponde alla loro densità intrinseca, formando una banda. La banda di 
DNA viene quindi rimossa dal gradiente e purificata dal CsC1l mediante precipi- 
tazione con alcol. Uno dei vantaggi di questa tecnica è anche rappresentato 
dalla capacità di separare differenti specie di molecole di DNA (Fig. 2.24). 
L'aggiunta del bromuro di etidio nella miscela di centrifugazione ha come risul- 
tato il suo legame al DNA. Le costrizioni di forma del DNA superavvolto impli- 
cano che le molecole di DNA circolari chiuse (i plasmidi) siano in grado di le- 
gare solo una quantità limitata di etidio bromuro. Molecole circolari di DNA ri- 
lassate (con un nick) o il DNA lineare sono in grado di legare una quantità su- 
periore di etidio bromuro che, inoltre, ne provoca un notevole srotolamento 
(Fig. 2.12). Di conseguenza, il DNA lineare e rilassato saranno meno densi del 
loro equivalente superavvolto e quindi si localizzeranno in punti differenti del 
gradiente di CsCl/EtBr. Il maggiore inconveniente della centrifugazione in gra- 
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Figura 2.24. Centrifugazione di molecole di DNA in un gradiente all'equilibrio di densità di cesio 
cloruro-etidio bromuro. Il campione di DNA è mescolato con cesio cloruro ed etidio bromuro e centri- 
fugato ad elevata velocità per circa 48 ore. Ogni molecola si localizza nel gradiente in una zona 
corrispondente alla sua densità, che per il DNA è influenzata dall'ammontare dello srotolamento 
indotto dal bromuro di etidio. 


diente di densità è rappresentato dal lungo tempo richiesto per generare il gra- 
diente all’equilibrio, per cui il corretto posizionamento del DNA richiede 36-48 
ore. Recentemente, con l’introduzione di kit commerciali per l'isolamento rapido e 
poco costoso del DNA, la tecnica di centrifugazione ha perso la sua importanza. Il 
principio di questi kit sarà discusso più avanti. 

L’isolamento del DNA plasmidico è di fondamentale importanza per il clonag- 
gio e per la manipolazione in vitro dei geni. Un problema ovvio è come separare 
l’esigua concentrazione di DNA plasmidico dalla notevole quantità di DNA geno- 
mico presente nella stessa cellula. Ancora una volta la lisi cellulare rappresenta un 
passaggio importante: infatti una lisi insufficiente o troppo spinta producono lo 
stesso risultato: una bassa resa di DNA plasmidico. Il metodo più popolare per iso- 
lare il DNA plasmidico dalle cellule si basa sul protocollo originale messo a punto 
da Birnboim e Doly (1979). Tale metodo, noto come lisi alcalina, si basa sul fatto 
che dopo trattamento a pH alcalino (tra 12 e 12,5) il DNA circolare chiuso, ma non 
quello lineare, rinatura più facilmente in seguito a neutralizzazione. Questi metodi 
portano inevitabilmente alla parziale frammentazione del DNA circolare del cro- 
mosoma di £. coli producendo lunghi frammenti di DNA lineare. La maggior parte 
dei metodi per estrarre il DNA plasmidico si basa su questa osservazione e richiede 
colture molto piccole di cellule batteriche (1-5 ml), da cui si ottiene una resa di ol- 
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Figura 2.25. Purificazione di DNA plasmidico. Le cellule batteriche che contengono il DNA plasmi- 
dico sono rotte utilizzando SDS. La presenza di idrossido di sodio garantisce la denaturazione del 
DNA. Dopo neutralizzazione, il DNA genomico aggrega e forma un precipitato insieme ai complessi 


SDS-proteine. Il precipitato può essere rimosso per centrifugazione. Il DNA plasmidico rimasto in 
soluzione è legato ad una matrice che non trattiene i contaminanti e può quindi essere eluito. 
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tre 10 ug di DNA (procedura mini-prep). Il metodo tipico per isolare il DNA pla- 
smidico consta dei seguenti passaggi (Fig. 2.25). 


e Le cellule batteriche sono trattate con il detergente SDS in presenza di idrossido 
di sodio che crea un pH alcalino. L’SDS disgrega la membrana cellulare e dena- 
tura le proteine. Durante questo passaggio il DNA cromosomico viene parzial- 
mente degradato e denaturato, mentre il DNA plasmidico di dimensioni più pic- 
cole viene solo denaturato. 


e La miscela è poi neutralizzata con potassio acetato (pH 5,2). In seguito alla neu- 
tralizzazione, il DNA cromosomale non può facilmente rinaturare, e inoltre ag- 
grega formando un precipitato insolubile. L'elevata concentrazione di potassio 
causa anche la precipitazione dei complessi SDS-proteine e dell’RNA. Il DNA 
plasmidico rinatura e rimane in soluzione. 


e Si elimina il precipitato per centrifugazione e il DNA plasmidico presente nel 
supernatante può essere ulteriormente purificato. 


e Il DNA plasmidico è purificato da qualsiasi contaminante (metaboliti, RNA e 
eventuali frammenti di DNA genomico) mediante legame a matrici di silicio 0 a 
scambio ionico cariche positivamente (anioniche). Per molte procedure su pic- 
cola scala (mini-prep), il DNA plasmidico è legato ad una matrice di silicio in 
tampone contenente elevate concentrazioni di sale. In queste condizioni, gli altri 
contaminanti non si legano alla matrice e sono eliminati. Successivamente, il 
DNA può essere eluito utilizzando un tampone a bassa concentrazione di sale (0 
acqua). Le preparazioni di DNA su larga scala comportano il legame del DNA 
plasmidico ad una resina a scambio ionico carica positivamente, come DEAE 
(dietilaminoetanolo), in tampone contenente 1 M NaCl. Questa concentrazione 
salina permette il legame del DNA alla matrice, ma non il legame dei contami- 
nanti. Dopo lavaggio della resina, la concentrazione è portata a 1,6 M per eluire 
il DNA. Procedure come queste comportano quindi la precipitazione del DNA 
dalla soluzione con etanolo o isopropanolo e la sua risospensione in tampone a 
bassa concentrazione di sale. Il DNA è quindi pronto per essere utilizzato in 
molti protocolli di biologia molecolare. 


Concetti chiave 


+ | vettori sono molecole di DNA a replicazione autonoma che pos- 
sono essere utilizzati per trasferire frammenti di DNA esogeni 


* | frammenti di DNA clonati in vettori possono essere isolati in quan- 
tità sufficienti per la maggior parte delle manipolazioni di laboratorio 


+ | vettori si basano su sequenze di DNA naturali che sono state modi- 
ficate e combinate per svolgere funzioni particolari 


+ La scelta del vettore dipende, per lo più, dalla dimensione della 
molecola di DNA che deve essere clonata 


+ Sono stati sviluppati vettori per una varietà di utilizzi, inclusi la produ- 
zione di DNA a singolo filamento, l’espressione a livelli elevati di geni 
codificanti proteine, e la produzione di RNA 


La grande maggioranza degli esperimenti di clonaggio utilizza il batterio 
Escherichia coli per la propagazione dei frammenti di DNA clonati. Anche se la 
destinazione finale del frammento di DNA clonato è una cellula eucariotica, i co- 
strutti di DNA sono invariabilmente prodotti in E. coli, prima di essere trasferiti 
nell’ospite definitivo. Il clonaggio è possibile anche in altri organismi, ma i van- 
taggi di E. coli hanno condotto al suo diffuso utilizzo come l’organismo d’eccel- 
lenza per tecniche di ingegneria genetica. Escherichia coli, che deve il nome al me- 
dico tedesco Theodor Escherich (1857-1911), è un batterio gram-negativo a ba- 
stoncello che si muove grazie a lunghi flagelli che ruotano velocemente (Figura 
3.1). Esso fa parte della normale flora batterica, presente nella bocca e nell’inte- 
stino dell’uomo, dove aiuta a proteggere il tratto intestinale dalle infezioni batteri- 
che, favorisce la digestione e produce basse quantità di vitamine B12 e K. Il batte- 
rio, che si trova anche nell’acqua e nel terreno, è ampiamente utilizzato nei labora- 
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Figura 3.1. Struttura del batterio Escherichia coli. Modello in sezione del batterio, che mostra alcuni 
degli strati cellulari e dei suoi componenti; cellule di E. coli visualizzate al microscopio elettronico. 


tori di ricerca ed è probabilmente la forma di vita più studiata. Come organismo da 
laboratorio, E. coli possiede diversi vantaggi caratteristici. 


* È facile da coltivare in terreno semplice ed economico. 


* L'organismo, durante la fase di crescita esponenziale, ha un tempo di duplica- 
zione di circa 20-30 minuti. 


e La sua genetica è ben conosciuta. 


e I ceppi di E. coli da laboratorio sono generalmente non infettivi e contengono 
mutazioni che non ne consentono la diffusione al di fuori del laboratorio. 


e Il suo genoma è interamente mappato e sequenziato. 


* Si possono sfruttare molecole di DNA extra-cromosomali (plasmidi e batterio- 
fagi) per inserire DNA esogeno. 


Le cellule di E. coli, generalmente, si riproducono in maniera asessuata, ma, per 
aumentare la variabilità e condividere il pool genetico, possiedono anche meccani- 
smi per il trasferimento dell’informazione genetica da un batterio all’altro. Già a 
metà degli anni ‘40 si sapeva che le cellule batteriche erano in grado di scambiare 
tra loro materiale genetico in maniera semi-sessuata. Gli esperimenti di Lederberg 
e Tatum hanno dimostrato chiaramente che il trasferimento dell’informazione ge- 
netica avviene mediante coniugazione batterica (Lederberg and Tatum, 1946). La 
capacità di compiere tale trasferimento è conferita da un gruppo di geni chiamato F 
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(per fertilità). Questi geni possono trovarsi su una molecola di DNA circolare che è 
replicata indipendentemente dal cromosoma batterico, alternativamente essi pos- 
sono essere integrati nel cromosoma. Un batterio che contiene tali geni (spesso de- 
finito batterio “maschio”) utilizza un pilo per attaccarsi ad un batterio adiacente. 
Le due cellule poi si avvicinano, ed il DNA è trasferito da un batterio all’altro. Esi- 
stono tre versioni del fattore di fertilità. 


* F- chiamato anche F episomico. È una grande molecola di DNA circolare a 
doppio filamento (99,159 bp) che contiene solo geni di fertilità. È mantenuto nel 
batterio come plasmide extra-cromosomale. 


* Hfr— l'elemento F è stato integrato nel genoma di £. coli. Quando avviene la 
coniugazione, i geni F cominciano ad essere trasferiti attraverso il pilo, portan- 
dosi dietro il resto del genoma. Ad un certo punto il pilo si rompe, così che ge- 
neralmente non viene trasferito l’intero genoma. Il genoma batterico è misurato 
in minuti, a partire dall’origine del trasferimento. Tale misura indica il tempo 
necessario perché un particolare gene possa essere trasferito da un batterio al- 
l’altro, e definisce la distanza del gene dall’origine di replicazione. 


e F'- questo è una grossa molecola di DNA circolare a doppio filamento che con- 
tiene i geni di fertilità ed alcuni altri geni. Questi ultimi sono trasferiti molto ef- 
ficientemente da un batterio all’altro, perché la dimensione della molecola di 
DNA trasferita è sufficientemente corta da consentire il passaggio attraverso la 
connessione tra le due cellule, prima che il pilo si rompa. 


La capacità di F' di essere replicato e mantenuto come un'entità separata dal cro- 
mosoma batterico ne farebbe il candidato ideale per il trasferimento di sequenze di 
DNA esogene. Come vedremo poi, versioni modificate dell’episoma F' sono state 
adattate per trasferire frammenti di DNA esogeno. D’altra parte, la dimensioni del 
fattore F' ne preclude un'analisi ed una manipolazione semplice, e le sue capacità 
di essere trasferito da una cellula all'altra possono renderlo instabile. 

In generale, frammenti di DNA esogeno devono essere contenuti in un vettore 
per assicurare la loro propagazione e replicazione in una cellula ospite. La migliore 
descrizione di un vettore è probabilmente: una sequenza di DNA, capace di repli- 
carsi in maniera autonoma, che può essere utilizzata per trasferire frammenti di 
DNA esogeni. Tutti i vettori sono basati su sequenze di DNA naturali che, in parti- 
colari circostanze, possono essere replicate. I vettori utilizzati più comunemente 
sono basati su plasmidi o sul batteriofago lambda (4). In generale, i vettori possono 
essere immaginati come una serie di moduli discreti che conferiscono le caratteri- 
stiche fondamentali per un clonaggio efficiente. Un vettore che viene utilizzato 
prevalentemente per amplificare un frammento di DNA è spesso definito vettore di 
clonaggio, mentre se esso è utilizzato per esprimere un gene contenuto nel fram- 
mento di DNA clonato, è chiamato vettore di espressione. 


112 


VETTORI 


3 


Tabella 3.1. Proprietà generali dei vettori utilizzati più comunemente 


Vettore Principali utilizzi Dimensione Esempi 
massima 
dell’inserto (kb) 

Plasmide Manipolazione generale del DNA 10-20 pBR322, pUC18 
Numerosi derivati specializzati 

A (inserimento) Costruzione di librerie a cDNA -10 Agtll 

A (sostituzione) Costruzione di librerie genomiche -23 AZAP, EMBL4 

Cosmide Costruzione di librerie genomiche -44 pJjB8 

M13 Mutagenesi in vitro 8-9 M13mp18 
Sequenziamento del DNA 

Fagmide Manipolazione generale del DNA 10-20 pBluescript 
Mutagenesi in vitro 

YAC Costruzione di librerie genomiche 1000-2000 pYAC4 

PAC Costruzione di librerie genomiche 75-90 pAd10SacBII 

BAC Costruzione di librerie genomiche 130-150 pBAC108L 


Un vettore, perché sia utile per il clonaggio, deve possedere le seguenti caratte- 
ristiche: 


* capacità di replicazione autonoma 


* una caratteristica selezionabile, così che le cellule trasformate possano essere di- 
stinte da quelle non trasformate. 


Inoltre, la maggior parte dei vettori contiene almeno uno e spesso più, siti di rico- 
noscimento per enzimi di restrizione, così che i frammenti di DNA possano essere 
inseriti nel vettore in maniera relativamente facile. Oggi è disponibile un vasto nu- 
mero di vettori, molti dei quali sono specializzati e progettati per svolgere funzioni 
specifiche. In questo capitolo, discuterò alcuni aspetti fondamentali della progetta- 
zione di vettori, ma mi concentrerò sui vettori che sono utilizzati normalmente in 
esperimenti di clonaggio (Tabella 3.1). 


3.1 Plasmidi 


I plasmidi sono elementi extra-cromosomali naturali che sono ereditati in maniera 
stabile da una generazione all’altra nel loro stato extra-cromosomale. I plasmidi 
sono ampiamente diffusi tra i procarioti e la loro dimensione varia da circa 1.500 
bp ad oltre 300 kbp. La maggior parte dei plasmidi esiste come molecole circolari 
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a doppio filamento, che spesso conferiscono un fenotipo particolare alle cellule 
batteriche nelle quali si replicano. Il plasmide frequentemente contiene un gene 
che codifica per una resistenza ad antibiotici o metalli pesanti oppure un gene che 
produce enzimi di restrizione e modificazione, che il batterio normalmente non 
possiederebbe. La replicazione del plasmide è spesso accoppiata a quella della 
cellula ospite; il plasmide è così replicato allo stesso tempo del genoma cellulare. 
I plasmidi sono spesso definiti come rilassati o stringenti, sulla base del numero di 
copie plasmidiche che sono mantenute nella cellula. I plasmidi rilassati (da non 
confondersi con DNA rilassato, Capitolo 1) sono mantenuti in più copie per cel- 
lula (10-200), mentre i plasmidi stringenti sono presenti in singola copia o in un 
basso numero di copie per cellula (1-2). Almeno parte di questa differenza è do- 
vuta ai diversi meccanismi che i plasmidi utilizzano per la propria replicazione. In 
generale, plasmidi rilassati sono replicati da proteine derivate dall’ospite, mentre 
plasmidi stringenti codificano per fattori proteici necessari per la propria replica- 
zione. 


Riquadro 3.1 Nomenclatura di geni e DNA 


I nomi assegnati a plasmidi, geni ed altri frammenti di DNA possono, a prima 
vista, sembrare una mera collezione di lettere e numeri. La procedura per la 
denominazione di geni e segmenti di DNA fu stabilita dai genetisti che descri- 
vevano geni associati a fenotipi visibili, ad es. c e A per i loci albino e agouti, 
rispettivamente, per il colore del mantello nel topo. Altri nomi di geni ne riflet- 
tono la funzione biologica, per esempio, Hbb per la catena B dell’emoglobina, 
e Adh per l’attività enzimatica alcool deidrogenasi. I genetisti di Drosophila 
hanno sviluppato una nomenclatura stravagante con nomi come fushi tarazu 
(ftz, dalle parole giapponesi che significano “mancante di segmento”), spéitzle 
(spz, un tipo di gnocco tedesco), dunce (dnc), forkhead (fkh), hedgehog (hh) e 
ether-a-go-g0 (eag). L'assegnazione delle posizioni cromosomiche per geni a 
funzione sconosciuta è cominciata poco dopo la messa a punto di spreads me- 
tafasici, metodologie di bandeggio cromosomico, ibridi cellulari somatici, se- 
parazione di isozimi e capacità di associare geni e fenotipi a siti particolari sui 
cromosomi. È anche diventato comune utilizzare lo stesso nome per il gene e 
per l’enzima o proteina da esso codificato. Spesso, il nome del gene è scritto 
in corsivo, mentre il nome del prodotto genico non ha un formato particolare. 
Questo può causare confusione, infatti non c’è una regola chiara. Inoltre, la 
nomenclatura usata in un organismo o in una specie può essere diversa da 
quella di un’altra specie. Questo approccio non sistematico alla nomenclatura 
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genica porta ad avere medesime funzioni con nomi differenti in organismi 
diversi, e anche a casi di geni che hanno nomi multipli all’interno dello 
stesso organismo, a seconda del gruppo di ricerca che lo ha identificato. 

Tradizionalmente, i plasmidi ricombinanti hanno le iniziali del loro crea- 
tore, seguite da un numero che può indicare la successione numerica nel 
quale il plasmide era stato generato, oppure potrebbe avere qualche signifi- 
cato più profondo. Per esempio, nel nome pBR322 si possono distinguere i 
seguenti componenti: 


* p- plasmide 


* BR- derivato da Paco Bolivar e Ray Rodrigues, che svilupparono il pla- 
smide (Bolivar et al., 1977) e 


e 322- il numero del plasmide nella loro collezione di DNA. 


Plasmidi costruiti nel mio laboratorio hanno la nomenclatura pRIRXXX, 
dove XXX è un numero a tre cifre che indica l’ordine nel quale i plasmidi 
sono stati costruiti così che essi possano essere facilmente identificati nel- 
l’elenco dei plasmidi del laboratorio. Altri plasmidi sono denominati se- 
guendo regole precise, ma oscure, ad es. i plasmidi pUC devono il loro 
nome a l’Università di California, mentre altri hanno nomi che più pronta- 
mente ne indicano la funzione principale, ad es pYAC4. Sebbene siano stati 
compiuti diversi tentativi per standardizzare la nomenclatura (White, Mattais 
and Nebert, 1998), i nomi storici tendono ad essere mantenuti. Infatti, la no- 
menclatura del DNA sulla base del costruttore consente una grande variabi- 
lità che sarebbe altrimenti difficile ottenere. 


La maggior parte dei plasmidi oggi in uso è basata sull’origine di replicazione 
del plasmide naturale ColEldìi E. coli, o del suo parente stretto pMBI (vedi il ri- 
quadro 3.1 per una descrizione della nomenclatura plasmidica). ColE1 è una mole- 
cola di DNA circolare a doppio filamento di 6.646 bp, che codifica per una batte- 
riocina, la colicina El (il prodotto del gene cea), e contiene un gene di resistenza 
che consente al batterio ospite di sopravvivere agli effetti della batteriocina (il pro- 
dotto del gene imm). La colicina El è una proteina transmembrana che nei batteri 
causa una depolarizzazione letale della membrana (Konisky and Tokuda, 1979). Il 
gene responsabile della resistenza codifica per una proteina che interferisce con 
l’azione della colicina inibendone la capacità di formare un canale attraverso la 
membrana del batterio (Zhang and Cramer, 1993). Batteri che contengono il pla- 
smide ColEl possono essere riconosciuti da quelli che non lo contengono per la 
loro capacità di crescere su piastre che contengono colicina El. Questo tipo di 
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screening è però tecnicamente difficile ed è stato abbandonato da tempo a favore di 
metodi più semplici basati su antibiotici (vedi sotto). 

Il plasmide ColEl viene replicato in maniera rilassata utilizzando la DNA poli- 
merasi fornita dalla cellula ospite. A differenza dell’origine di replicazione batte- 
rica (OriC), la replicazione di ColEl procede in maniera unidirezionale. Il pla- 
smide non codifica proteine che iniziano il processo replicativo, ma codifica per di- 
verse molecole di RNA non tradotte, che sono implicate nell’inizio della replica- 
zione, e per una proteina coinvolta nella regolazione delle molecole di RNA. L’ori- 
gine di replicazione di ColEl si trova in una regione del DNA dalla quale sono tra- 
scritte costitutivamente due molecole di RNA (RNAI e RNAII) a partire dai propri 
promotori (Figura 3.2). RNAII è complementare all’origine di replicazione di 
ColEl e si associa ad essa a formare un ibrido DNA-RNA (Cesareni er al., 1991). 
La molecola di RNAII legata viene tagliata sull’origine dall’enzima RNasiH codi- 
ficato dalla cellula ospite e serve come innesco per l’inizio di replicazione. Me- 
diante appaiamento tra basi complementari, RNAII può associarsi solo ad un fila- 
mento di DNA, e quindi la replicazione di ColEl è unidirezionale. 


Figura 3.2. Il plasmide ColE1 e l'origine di replicazione. Il plasmide ColE1 è una molecola circolare 
a doppio filamento di 6,646 bp. Tra le altre cose, codifica la batteriocina colicina E1 (il prodotto del 
gene cea) ed una proteina di immunità (il prodotto del gene imm) che previene gli effetti tossici della 
batteriocina in cellule che ospitano il plasmide. La replicazione del DNA avviene in un’unica dire- 
zione, come indicato dalla direzione della freccia ori. Due molecole di RNA non tradotte, chiamate 
RNAI ed RNAII, e la proteina prodotta dal gene rop, controllano il processo replicativo — vedi il testo 
per dettagli. Sono mostrate anche le posizioni di questi elementi di controllo della replicazione relati- 
vamente all’origine (ori). Le frecce sui geni indicano la direzione della trascrizione. 
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Il controllo del processo replicativo è ottenuto mediante un’altra molecola di 
RNA non tradotta. RNAI è complementare all’estremità 5° di RNAII e forma con 
essa un RNA duplex che non funziona come innesco per la replicazione. RNAI ha 
una vita media relativamente breve e di conseguenza il plasmide ColEl viene man- 
tenuto in circa 15-20 copie per cellula. L'interazione tra RNAI ed RNAII è stabiliz- 
zata dalla proteina ROP (Helmer-Citterich et al., 1988). 

Il meccanismo replicativo impiegato da ColEl ha numerose conseguenze im- 
portanti. La combinazione di regolatori causa incompatibilità plasmidica, vale a 
dire, due plasmidi con la stessa origine di replicazione non possono coesistere nella 
stessa cellula. RNAI del plasmide residente impedisce a RNAII del secondo pla- 
smide di formare un innesco, prevenendone la replicazione. Questo è importante 
per gli esperimenti di clonaggio quando una popolazione mista di plasmidi, che è 
spesso il prodotto di una reazione di ligazione, viene trasformata in batteri. Tra- 
sformanti singoli prodotti in questo modo, conterranno un unico plasmide e non 
una popolazione mista. Plasmidi con origini di replicazione diverse (es. ColEl e 
p15A) possono coesistere nella stessa cellula. Ulteriore conseguenza del meccani- 
smo di replicazione di ColEI è che non è richiesta nuova sintesi proteica per ini- 
ziare la replicazione del DNA. In presenza di antibiotici che bloccano la sintesi 
proteica (es. cloramfenicolo), la replicazione del DNA cromosomico è arrestata, 
ma i plasmidi basati su ColEl continuano a replicarsi e ad accumularsi a livelli ele- 
vati (1.000-2.000 copie per cellula) (Clewell, 1972). 


3.1.1 pBR322 


ColEl, e il suo simile pMBI, sono potenzialmente utili come vettori di clonag- 
gio, ma hanno diversi svantaggi. Soprattutto, la difficoltà nell’identificazione dei 
plasmidi ricombinanti (quelli nei quali il DNA plasmidico è stato legato ad un in- 
serto) non ne ha facilitato un’ampia diffusione. Era necessario un plasmide che 
potesse essere replicato come ColEl, ma nel quale fosse facile identificare i ri- 
combinanti. 


Il plasmide pBR322 (Figura 3.3) è stato il primo vettore plasmidico ampia- 
mente diffuso. È un plasmide piccolo (4.363 bp) costruito utilizzando componenti 
di plasmidi naturali ed altri frammenti di DNA (Bolivar er al., 1977). pBR322 con- 
tiene i seguenti elementi. 


e Origine di replicazione. pBR322 possiede l’origine di replicazione di ColEl ed 
il gene rop che assicura il mantenimento in un numero di copie ragionevolmente 
elevato (15-20 copie per cellula, che può essere elevato 200 volte amplificando 
con cloramfenicolo). 
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Figura 3.3. Il plasmide pBR322. Questo plasmide contiene l’origine di replicazione di ColE1 (ori e 
rop), assieme a due geni per la resistenza ad antibiotici. Il gene per la resistenza all’ampicillina 
(AMPS, o bla codificante per la B-lattamasi) ed il gene per la resistenza alla tetraciclina (TET®) con- 
tengono entrambi diversi siti di riconoscimento per enzimi di restrizione che compaiono una sola 
volta nell'intera sequenza plasmidica. 


* Geni per la resistenza ad antibiotici. pBR322 possiede due geni che possono es- 
sere utilizzati come marcatori selettivi. Il gene per la resistenza all’ampicillina 
(chiamato bla o, più comunemente AMP*) è stato clonato nel plasmide dal tra- 
sposone Tn3, e il gene per la resistenza alla tetraciclina (chiamato tet o TET®) è 
stato clonato dal plasmide pSC101 (Bernardi and Bernardi, 1984). 


e Siti di clonaggio. Il plasmide contiene diversi siti unici di riconoscimento per 
enzimi di restrizione. Alcuni di questi si trovano in uno o l’altro dei geni per la 
resistenza agli antibiotici. Per esempio, in AMP si trovano siti per PstI, Pvul e 
SacI, e in TETR si trovano siti per BamHI e HindIII. 


I geni per la resistenza agli antibiotici in pBR322 consentono la selezione diretta 
dei ricombinanti grazie ad un fenomeno chiamato inattivazione inserzionale. Per 
esempio, se clonassimo un frammento di DNA nel sito BamHI di pBR322, l’in- 
serto di DNA interromperebbe il gene responsabile della resistenza alla tetraci- 
clina, ma il gene per la resistenza all’ampicillina non sarebbe alterato. Le cellule 
trasformate verrebbero dapprima cresciute in un terreno contenente ampicillina per 
eliminare le cellule prive di plasmide. Le colonie cresciute su ampicillina sareb- 
bero poi replicate su un terreno contenente sia ampicillina che tetraciclina. Le cel- 
lule capaci di crescere in presenza di ampicillina, ma incapaci di sopravvivere alla 
selezione con tetraciclina, contengono plasmidi che hanno inserti di DNA esogeno 
(Figura 3.4). In altre parole, l'inserzione di un frammento di DNA esogeno in un 
gene per la resistenza ad un antibiotico inattiva il prodotto genico e causa sensibi- 
lità all’antibiotico. 
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Figura 3.4. Inattivazione inserzionale dei geni per la resistenza ad antibiotici in pBR322. Se un 
frammento di DNA esogeno viene inserito nel sito di riconoscimento per l'enzima di restrizione 
BamHI all’interno del gene TET®, il plasmide ricombinante ottenuto, quando trasformato in batteri, 
conferirà alle cellule resistenza all’ampicillina, ma sarà incapace di promuovere la crescita batterica 


su piastre contenenti tetraciclina. Il gene TETRA sarà funzionalmente inattivato dalla presenza dell’in- 
serto di DNA. 
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3.1.2 Plasmidi pUC 


pBR322 è stato fondamentale per la biologia molecolare poiché fu il primo pla- 
smide diffusamente utilizzato per il clonaggio, ma la procedura di doppio scree- 
ning necessaria per l’identificazione dei cloni ricombinanti era lenta e soggetta ad 
errori. Nel 1982, fu sviluppata una nuova serie di plasmidi che consentiva l’identi- 
ficazione delle cellule contenenti le molecole ricombinanti in un unico screening. 
Tali vettori si chiamano pUC (Vieira and Messing, 1982) ed hanno tre proprietà in 
più rispetto a pBR322 (Figura 3.5). 


e Alto numero di copie — una mutazione nell’origine di replicazione produce 
500-600 copie di plasmide per cellula, senza bisogno di amplificare con clo- 
ramfenicolo. La mutazione, una sostituzione da G ad A, cambia un nucleotide 


lacZ 
CE e 1:::5565:,:55:.-?”7?._7]2gp®'©?{]3{"'_{”?s:zK::# «GÈGSI 


srvioli, 8 DA CR: RG TI SS EL P _D_ GG. O WS S SO N I OL MI N 
HindIII PstI XbaIt Smal SacI 
5'-CcCAAGCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCgtaatcatggtcat-3' 
3'-ggTTCGAACGTACGGACGTCCAGCTGAGATCTCCTAGGGGCCCATGGCTCGAGCTTAAGcattagtaccagta-5' 


SphI HincII BamHI KpnI EcoRI 


Sito di clonaggio multiplo 


Figura 3.5. | plasmidi pUC. pUC18 è un piccolo plasmide che contiene una versione mutata dell’ori- 
gine di replicazione di ColE1 che ne consente una replicazione in alto numero di copie. Il plasmide 
contiene anche il gene per la resistenza all’ampicillina (AMP£) ed il gene /acZ’, che codifica per i 
primi 63 aminoacidi di /acZ — l’a-peptide. All’interno della sequenza codificante /acZ’ vi sono siti di ri- 
conoscimento per diversi enzimi di restrizione. Questo sito multiplo di clonaggio (o polylinker) è utiliz- 
zato per clonarvi frammenti di DNA. La presenza di inserti di DNA inattiva la funzione dell’a-peptide 
di /acZ ed è utilizzato per lo screening. Plasmidi pUC diversi hanno differenze nella composizione del 
polylinker. 
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a monte del sito d’inizio di RNAI riducendo il livello del trascritto RNAI, pro- 
vocando un aumento della replicazione del plasmide utilizzando RNAII come 
innesco. 


Screening blu-bianco — lo screening di questo tipo è una forma d’attivazione in- 
serzionale che può essere utilizzata durante la selezione primaria dei trasfor- 
manti, senza bisogno di ricorrere ad uno screening secondario. Esso utilizza la 
porzione amino-terminale della B-galattosidasi di E. coli (chiamata &-peptide), 
codificata dal vettore, in una forma di complementazione intermolecolare che ri- 
costituisce l’attività B-galattosidasica in un enzima difettivo (il peptide @), codi- 
ficato dall’ospite. L'enzima f-galattosidasi di E. coli è un grosso polipeptide 
(monomero = 1173 aminoacidi; 117 kDa) che è il prodotto del gene /acZ. La 
forma attiva dell'enzima è un omo-tetramero (468 kDa). Alcune mutazioni nella 
regione 5’ di /acZ impediscono l'associazione tra le subunità mutanti (peptide ©) 
ed il monomero non possiede attività enzimatica (Ullmann, 1992). In alcuni di 
tali mutanti, l’assemblaggio delle subunità (e l’attività enzimatica) può essere ri- 
costituito dalla presenza di un piccolo frammento (circa 50 aminoacidi) amino- 
terminale del prodotto di /acZ (il polipeptide @) (Juers et al., 2000). Questi 
mutanti /acZ sono soggetti ad a-complementazione. Il prodotto dell’allele 
lacZAM15 manca degli aminoacidi 11-41 della sequenza primitiva della B-galat- 
tosidasi ed è soggetto ad c:-complementazione. Messing e collaboratori hanno 
approfittato dell’o-complementazione nel costruire la serie di pUC di vettori di 
clonaggio (Vieira and Messing, 1982). Tali vettori contengono un sito multiplo 
di clonaggio (multiple cloning site; MCS) all’interno della sequenza per il fram- 
mento codificante l’a-peptide. Il MCS non modifica il modulo (frame) di lettura 
di /acZ e non altera la capacità del frammento di effettuare a-complementazione 
(Figura 3.6). L'inserzione di altri frammenti di DNA nel MCS provoca l’interru- 
zione della sequenza codificante l’a-peptide, rendendolo non funzionale. Se le 
piastre utilizzate per lo screening primario dei trasformanti contengono un sub- 
strato cromogenico (XGal, 5-bromo-4-cloro-3-indoy1-B-D-galactopiranoside) ed 
un induttore della B-galattosidasi (IPTG), le molecole non ricombinanti cause- 


Figura 3.6. a-complementazione e colorazione con XGal. Una 5-galattosidasi funzionante taglia il 
XGal (5-bromo-4-cloro-3-indoyl-8-D-galactopiranoside) in galattosio ed in un derivato del 5-bromo-4- 
cloro-indossile. L'indossile dimerizza spontaneamente e si ossida a formare un colorante blu insolu- 
bile (5,5°-dibromo-4,4’-dicloro-indigo; non mostrato). L'enzima f-galattosidasi è il prodotto del gene 
lacZ e la forma attiva dell'enzima è un tetramero di polipeptidi identici. Alcuni mutanti di /acZ (come il 
lacZAM15) producono versioni della proteina mancanti dell’estremità amino terminale del polipeptide 
di 1173 aminoacidi. Tali derivati, chiamati @-peptide, sono incapaci di formare un tetramero attivo e 
non hanno attività 6-galattosidasica. Il @-peptide può essere reso funzionale co-esprimendo nella 
stessa cellula l’a-peptide di /acZ (aminoacidi 1-63). L’a-peptide promuove la formazione del tetrame- 
tro e ristabilisce l’attività enzimatica. 
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ranno il catabolismo del substrato incolore a dare colonie blu, mentre le mole- 
cole ricombinanti daranno colonie bianche. 


e Un sito multiplo di clonaggio o polylinker. Questo è un frammento sintetico di 
DNA che contiene la sequenza di riconoscimento per alcuni siti di restrizione 
unici. È stato inserito nella porzione del vettore che codifica per l’a-peptide 
della B-galattosidasi in modo da non alterarne l’espressione o la funzione. D'altro 
canto, l’inserzione di un frammento di DNA in qualunque dei siti di riconosci- 
mento per gli enzimi di restrizione presenti nel polylinker inattiva l’a-peptide. 
Le colonie ricombinanti rimarranno quindi bianche, ma quelle non ricombinanti 
diventeranno blu. 


Il vantaggio maggiore dei plasmidi pUC rispetto a pBR322 è che il frammento di 
DNA esogeno può essere clonato in numerosi siti di restrizione diversi e che i ri- 
combinanti possono essere rapidamente identificati. Inoltre, 1’ -complementazione 
richiede solo che il plasmide contenga un gene piccolo. Il DNA codificante per 
o.-peptide nei plasmidi della serie pUC è più corto di 400 bp. Se fosse necessario 
l’intero gene /acZ, questi vettori dovrebbero contenere una sequenza più lunga di 
3.500 bp. In generale, la stabilità di numerosi vettori plasmidici diminuisce al cre- 
scere della dimensione della molecola. Questo porta ad una riduzione della dimen- 
sione del frammento massimo che può essere clonato all’interno del vettore. Per 
esempio, la capacità delle cellule batteriche di mantenere plasmidi pUC ricombi- 
nanti diminuisce significativamente quando la loro dimensione si avvicina a 15 kbp 
(Tabella 3.1). Poiché l’a-peptide è piccolo, la dimensione totale del vettore è ri- 
dotta, permettendo il clonaggio di inserti più lunghi. 


3.2 Marcatori selettivi 


Una caratteristica essenziale dei plasmidi che abbiamo descritto finora è la possibi- 
lità di selezionare in maniera accurata le cellule che contengono il plasmide. Oggi 
sono disponibili numerosi sistemi di selezione. La scelta del marcatore selettivo si 
basa normalmente sul tipo di cellula che viene trasformata. Alcuni dei marcatori 
funzionano solo in sistemi procarioti, mentre altri hanno uno spettro d’azione più 
ampio. Alcuni dei marcatori selettivi usati comunemente sono elencati qui sotto as- 
sieme al loro meccanismo d’azione. 


e Ampicillina — lega ed inibisce numerosi enzimi della membrana batterica che 
sono implicati nella sintesi della parete delle cellule gram-negative. In pre- 
senza di ampicillina, quindi, la duplicazione cellulare non può avvenire cor- 
rettamente. Il gene della resistenza all’ampicillina (AMP® o bla) codifica per 
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l’enzima fB-lattamasi che viene secreto nello spazio periplasmatico del batte- 
rio, dove catalizza l’idrolisi dell’anello B-lattamico dell’ampicillina. Il pro- 
dotto del gene AMPR, quindi, distrugge l'antibiotico. Col tempo l’ampicillina 
presente nel terreno di coltura o nella capsula Petri viene distrutta dalla B-lat- 
tamasi; quando questo avviene, la pressione selettiva per il mantenimento del 
plasmide viene persa e si osserva comparsa di popolazioni cellulari prive del 
plasmide. 


Tetraciclina — lega una proteina della subunità 30S del ribosoma ed inibisce la 
traslocazione del ribosoma lungo il mRNA e quindi interferisce con la tradu- 
zione proteica. Il gene per la resistenza alla tetraciclina (TET®) codifica per una 
proteina di 399 aminoacidi, associata alla membrana esterna delle cellule gram- 
negative, che previene l’entrata dell’antibiotico nella cellula. Il gene per la resi- 
stenza all’antibiotico, quindi, non distrugge l’antibiotico. La pressione selettiva 
per il mantenimento del plasmide contenente il gene di resistenza viene conser- 
vata in tutta la coltura. 


Cloramfenicolo — lega la subunità 50S del ribosoma ed inibisce la sintesi pro- 
teica. Il gene per la resistenza al cloramfenicolo (CM) codifica per la cloramfe- 
nicolo acetil-trasferasi (CAT). La proteina CAT è una proteina citosolica tetra- 
merica che, in presenza di acetil-coenzima A, catalizza la formazione di derivati 
idrossil acetossi del cloramfenicolo che non sono capaci di legare il ribosoma. 
Come nel caso dell’ampicillina, il prodotto del gene CMR distrugge l’antibio- 
tico. 


Kanamicina e neomicina — lega componenti del ribosoma ed inibisce la sintesi 
proteica. Il gene KANE codifica per una proteina che viene secreta nello spazio 
periplasmico ed interferisce con il trasporto di questi antibiotici nella cellula. 
Come nel caso della resistenza alla tetraciclina, il prodotto del gene KANR non 
distrugge l'antibiotico. 


Bleomicina e zeocina — antibiotici glicopeptidici che legano il DNA ed inibi- 
scono la sintesi di DNA e RNA. Sono attivi verso quasi tutti i batteri (incluso 
E. coli), microrganismi eucariotici (ad es. lievito), cellule vegetali e cellule ani- 
mali. Il gene SA ble dal batterio Streptoalloteichus hindustanus codifica per una 
piccola proteina che conferisce resistenza alla zeocina legandosi all’antibiotico 
(Gatignol, Durand and Tiraby, 1988). 


Igromicina B — inibisce la traduzione interferendo con la traslocazione dei ribo- 
somi. L’antibiotico è attivo verso procarioti ed eucarioti. Il gene per la resistenza 
(HYGR, codificante per igromicina-B-fosfotransferasi) inattiva l’antibiotico fo- 
sforilandolo. 
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I vettori basati su plasmidi sono ampiamente utilizzati e sono stati adattati a nume- 
rose funzioni. Molte di queste saranno discusse in capitoli successivi di questo li- 
bro, ma qui elencherò diversi esempi per dare al lettore un’idea della varietà di uti- 
lizzo dei plasmidi. 


e Clonaggio — la maggior parte delle manipolazioni del DNA effettuate in labora- 
torio viene fatta in plasmidi. La semplicità di utilizzo e stoccaggio delle mole- 
cole di DNA plasmidico ne hanno fatto una scelta diffusa per la maggior parte 
degli esperimenti che coinvolgono DNA ricombinante. 


* Vettori navetta (shuttle) — questi plasmidi contengono non solo l’origine di 
replicazione ed il marcatore selettivo per £. coli, ma anche sequenza funzio- 
nalmente simili per il mantenimento in altri ospiti. Per esempio. plasmidi per 
il clonaggio e l’espressione di geni nel lievito Saccharomyces cerevisiae con- 
tengono origini di replicazione e marcatori selettivi sia per E. coli che per lie- 
vito. La maggior parte delle manipolazioni del DNA vengono effettuate uti- 
lizzando E. coli come ospite, prima della trasformazione del costrutto defini- 
tivo in lievito. 


* Produzione di RNA — molti plasmidi sono stati costruiti in modo che i fram- 
menti di DNA clonati potessero essere trascritti in RNA. Tali plasmidi conten- 
gono siti promotore per una RNA polimerasi, per esempio quelle dei batterio- 
fagi T3, T7 o SP6, così che I' RNA possa essere sintetizzato in vitro utilizzando 
lPRNA polimerasi purificata ed il DNA plasmidico. L’RNA prodotto in questo 
modo viene spesso usato come sonda per ibridazione in esperimenti di Northern 
blotting. 


* Produzione di proteine — molti plasmidi contengono sequenze promotore per 
l’espressione dei geni eterologhi in essi clonati. Spesso l’espressione è realizzata 
in E. coli , ma, utilizzando promotori appropriati, l’espressione di proteine può 
essere ottenuta in qualunque organismo. Elevati livelli di espressione possono 
essere conseguiti con promotori forti, mentre livelli di espressione bassi si otten- 
gono con promotori deboli. I livelli di proteina prodotta possono anche essere 
modulati variando il numero di copie del plasmide. 


Data l'ampia varietà di plasmidi a disposizione dei ricercatori, sono stati sviluppati 
metodi per trasferire frammenti di DNA tra plasmidi con funzioni diverse. Per 
esempio, avendo un gene clonato, si potrebbe desiderare di esprimerlo ad alti li- 
velli in E. coli, e anche esprimerne la proteina in cellule di mammifero in coltura e 
produrre una versione della proteina contenente un epitopo sintetico, per il quale 
siano disponibili anticorpi monoclonali. Sono quindi stati sviluppati sistemi per il 
trasferimento di frammenti di DNA tra plasmidi, senza bisogno di ricorrere all’uso 
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Figura 3.7. Scambio di geni tra plasmidi mediante ricombinazione. | geni vengono trasferiti, ai siti 
loxR dal plasmide donatore al plasmide accettore, utilizzando la Cre ricombinasi. Vedere il testo per i 
dettagli. 


di enzimi di restrizione. Uno di tali sistemi è schematizzato in Figura 3.7. In questo 
caso, il frammento di DNA contenente il gene d’interesse viene trasferito da un 
plasmide all’altro mediante l’azione della Cre ricombinasi. Cre è una proteina di 
38 kDa derivata dal plasmide P1 (Sternberg et a/. 1981), che media la ricombina- 
zione tra sequenze specifiche chiamate siti /oxP (Abremski and Hoess, 1984). Tali 
siti consistono di due ripetizioni invertite di 13 bp, separate da una regione spazia- 
trice di 8 bp. L’orientazione dello spaziatore di $8 bp al sito /oxP spinge la ricombi- 
nazione ad avvenire secondo una direzione ed orientazione precisa. Il plasmide do- 
natore contiene due siti /oxP, che fiancheggiano il gene di interesse. Il plasmide ac- 
cettore contiene un singolo sito /oxP e gli elementi che saranno fusi al gene di inte- 
resse. Questo, una volta trasferito, sarà opportunamente posizionato rispetto agli 
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elementi necessari per l’espressione, che erano stati ingegnerizzati nel vettore ac- 
cettore. Inoltre, se la sequenza codificante del gene d’interesse è nella stessa cor- 
nice (frame) di lettura con il sito /oxP a monte nel vettore donatore, sarà automati- 
camente nello stesso frame di lettura con tutti i peptidi ingegnerizzati nel plasmide 
accettore. Un sistema alternativo di plasmidi donatore ed accettore è basato sulle 
reazioni di ricombinazione sito-specifica mediata dal fago À (Karimi, Inze and De- 
picker, 2002). In questo caso, frammenti di DNA fiancheggiati da siti di ricombina- 
zione (att) possono essere trasferiti n vettori contenenti siti di ricombinazione com- 
patibili (att x attP oppure attL x attR) in una reazione mediata dalle proteine ri- 
combinanti di À. 

La versatilità dei plasmidi ha portato alla loro ampia diffusione come vettori 
per numerosi esperimenti di manipolazione genica. Comunque, i plasmidi hanno 
alcune limitazioni significative. Primo, l’efficienza di trasferimento dei plasmidi 
nella cellula batterica è molto bassa. Le molecole di DNA plasmidico devono es- 
sere trasformate in cellule batteriche competenti (vedi Capitolo 2), ma questo pro- 
cesso è inefficiente. Nella migliore delle ipotesi, le cellule di E. colî possono es- 
sere rese competenti ad un livello tale che da un microgrammo di DNA si otten- 
gano 1 x 10° cellule trasformate. Per un plasmide tipico, 1 ug di DNA corrisponde 
a circa 1.5 x 10!! molecole. Questo significa che le cellule acquisiscono meno del 
1 per cento delle molecole di DNA disponibili. Secondo, la capacità dei plasmidi 
di contenere grossi frammenti di DNA è limitata (Tabella 3.1). La maggior parte 
dei plasmidi diventa instabile se la loro dimensione supera le 15 kbp. Plasmidi più 
grandi di così tendono ad andare incontro ad eventi ricombinanti, che possono pro- 
vocare il riarrangiamento o l’eliminazione di sequenze di DNA. Per superare que- 
ste difficoltà sono quindi stati sviluppati altri tipi di vettori. 
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Nei primi anni ‘50, André Lwoff descrisse una stupefacente proprietà di E. coli. 
Quando alcuni ceppi di E. coli venivano irradiati con dosi moderate di radia- 
zioni ultraviolette, i batteri smettevano di crescere e dopo circa 90 min., le cel- 
lule lisavano rilasciando nel mezzo di coltura numèrose particelle virali, chiamate 
A (Figura 3.8). I virus, più comunemente chiamati batteriofagi o semplicemente 
fagi, sono capaci di infettare altre cellule di E. coli che non erano mai state infet- 
tate in precedenza con fagi Z. Non tutte le cellule batteriche andavano incontro alla 
fase litica quando venivano irradiate in questo modo. Tali dosi di raggi ultravioletti 
erano relativamente ininfluenti per la maggior parte delle cellule di E. coli; mentre, 
batteri che erano stati preventivamente esposti al fago À, ma che non erano andati 
incontro a lisi, mostravano questa particolare caratteristica. 


- da n di 
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Figura 3.8. La struttura del batteriofago 2. Sono mostrate una fotografia al microscopio elettronico di 
particelle di fago Z che sono state rilasciate in seguito a lisi batterica, ed una rappresentazione sche- 
matica della struttura generale di A. La fotografia è un dono del Professor Ross Inman (Università del Wi- 
sconsin) ed è riprodotta con il suo permesso. Altre microfotografie eccellenti di X possono essere tro- 
vate sul sito web del Professor Inman (http://www.biochem.wisc.edu/inman/empics/) 


In seguito all’infezione da parte del fago A, le cellule di E. coli possono andare 
incontro a due diversi destini. 

La cellula può andare incontro a lisi cellulare e particelle fagiche di neosintesi 
vengono rilasciate nel mezzo di coltura circostante, oppure, in alternativa, il fago 
può passare in uno stato dormiente nel quale il DNA fagico viene integrato nel cro- 
mosoma di E. coli, ed in questo caso il fago diventa lisogenico. Il ciclo vitale del 
fago A è schematizzato in Figura 3.9. È il batterio lisogenico che va incontro a lisi 
rapida in seguito ad irraggiamento con ultravioletti. In laboratorio, la replicazione e 
la crescita del fago À viene monitorata su capsule Petri (Figura 3.10). Il fago viene 
mescolato con cellule di E. coli in una soluzione di soft agar chiamata top agar. La 
sospensione viene versata sulla superficie di una piastra contenente terreno di cre- 
scita che viene poi incubata per consentire la crescita batterica. La crescita di 4 
causa la morte (lisi) delle cellule di E. coli intorno al sito dell’infezione iniziale, 
che può essere osservato sulla piastra come una placca relativamente torbida su 
una patina batterica. Il DNA di A può essere purificato dalle particelle fagiche con- 
tenute in queste placche. 

La genetica e la biologia molecolare del fago À sono state ampiamente stu- 
diate, per ulteriori informazioni su À, i lettori possono rivolgersi all’ottimo libro 
di Mark Ptashne (Ptashne, 1992). Il DNA contenuto nel fago è una molecola li- 
neare a doppio filamento lunga 48.502 bp. Le estremità 5’ e 3’ del genoma di 4 
hanno 12 paia di basi a singolo filamento, chiamate estremità coesive o cos. Tali 
sequenze sono complementari e possono appaiarsi tra loro originando una mole- 
cola circolare a doppio filamento (Figura 3.11). Geni funzionalmente correlati 
tra loro sono generalmente raggruppati nel genoma di À, eccetto per i due geni 
regolatori positivi N e Q. I geni sul lato sinistro della mappa genomica conven- 
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zionale codificano per le proteine della testa e della coda della particella fagica: 
sono seguiti da geni i cui prodotti sono implicati nella ricombinazione e nella li- 
sogenia, la quale prevede che il genoma fagico circolare sia integrato nel cromo- 
soma dell’ospite e sia così replicato stabilmente come profago. Sulla destra nella 
mappa sono localizzati geni coinvolti nella regolazione trascrizionale e nell’im- 
munità profagica alla superinfezione (N, cro, cl), seguiti dai geni per la sintesi 
del DNA, per la regolazione delle funzioni tardive (Q) e per la lisi della cellula 
ospite. 

La vasta conoscenza del fago À e i sistemi regolativi del ciclo litico e lisoge- 
nico hanno reso À un vettore ideale per il trasferimento di frammenti di DNA eso- 
geno. Il vantaggio maggiore dei vettori basati su À rispetto ai plasmidi è l’effi- 
cienza con la quale il fago può infettare E. coli. Come abbiamo discusso in prece- 
denza, la trasformazione del DNA plasmidico nei batteri non è un processo effi- 
ciente, mentre l'infezione con À è un metodo molto efficiente per introdurre DNA 
in una cellula batterica. Per comprendere come 4 possa essere sfruttato come vet- 
tore, è importante acquisire una conoscenza di base sul fago stesso. L'infezione di 
À e la lisi cellulare richiedono una serie di passaggi successivi. L'infezione av- 
viene in seguito all’adsorbimento della particella fagica da parte della cellula bat- 
terica mediata dal legame al recettore per il maltosio. Il DNA genomico di À è 
quindi iniettato nella cellula dove circolarizza immediatamente. A questo punto 
sono possibili due percorsi. 


* Via lisogenica. Il DNA fagico viene integrato nel genoma batterico (mediante ri- 
combinazione omologa tra attP ed il sito nel genoma batterico at:B) e viene re- 
plicato insieme al DNA batterico. Il DNA del profago rimane integrato fino a 
quando viene indotto ad entrare nel ciclo litico. 


* Via litica. Si ha la produzione su larga scala di particelle batteriofagiche (pro- 
teine e DNA) che porta alla lisi della cellula. 


La decisione tra ciclo litico e ciclo lisogeno è il risultato dell’attività della pro- 
teina cII. cII deve essere attiva per avere trascrizione del repressore cl e di al- 


Figura 3.9. Il ciclo vitale di A. In seguito all’infezione, il batteriofago 4 si attacca alla superficie della 
cellula batterica, ed il suo DNA entra nel batterio. Quasi immediatamente, il DNA di 4 circolarizza. A 
questo punto il DNA può entrare nel ciclo litico oppure nel ciclo lisogeno. Durante la lisogenia, il DNA 
di Z si integra nel cromosoma di £. coli e viene replicato, insieme al DNA dell'ospite, affinché il pro- 
fago venga trasmesso alle generazioni successive. Nella fase litica, il DNA di 4 non si integra, ma 
viene immediatamente replicato e trascritto per dare origine a nuove particelle fagiche. Infine, la cel- 
lula batterica va incontro a lisi ed il fago neo-formato viene rilasciato nel mezzo circostante. Il profago 
lisogenico può essere indotto ad entrare nel ciclo litico, ad esempio irraggiando le cellule con luce 
UV. In questo caso il DNA di 4 si excide dal genoma di E. coli ed il ciclo litico ha inizio. 
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Figura 3.10. Placche di X. Il fago A viene cresciuto in laboratorio su una patina di cellule batteriche. | 
batteri e le particelle di fago X vengono mescolate con del top agar liquido, ma non troppo caldo. La 
sospensione viene poi versata su una piastra di agar già preparata, sulla quale il top agar viene la- 
sciato solidificare. La piastra è quindi incubata per 12-16 h a 37°C. Le placche di 7 appaiono come 
cerchi torbidi nella patina batterica. 


cuni geni richiesti per l'integrazione del DNA fagico nel cromosoma di E. coli. 
Un cll attivo risulta nella scelta del ciclo lisogenico, mentre un cIl inattivo causa 
l’entrata nel ciclo litico. La proteina cIl è relativamente instabile e può essere ta- 
gliata ed eliminata dalle proteasi batteriche. Le condizioni ambientali influenzano 
l’attività di queste proteasi. Quando le cellule sono cresciute in terreno ricco, ad 
esempio, le proteasi sono generalmente attive, così che cII viene degradato e À se- 
gue il ciclo litico. In condizioni di carenza nutrizionale, le proteasi sono meno 
funzionali e, quindi, À seguirà più frequentemente la via lisogenica. Questo com- 


Non essenziale 
per il ciclo litico 


cos cos 


Non essenziale 
per il ciclo litico 


Figura 3.11. Le forme circolare e lineare del genoma di 2. Il DNA di 4 esiste in forma lineare nel 
batteriofago ed in forma circolare subito dopo l'ingresso nel batterio. Il passaggio dalla forma li- 
neare a quella circolare è mediato dalla complementarietà delle estremità sporgenti ai siti cos. 
Molti dei geni necessari per l’integrazione di X nel cromosoma dell’ospite, o per la replicazione e 
l'assemblaggio di nuovi fagi, sono raggruppati tra loro sul cromosoma di Z. In figura sono mostrati 
alcuni di tali geni o gruppi di geni; è anche indicata una regione del genoma non necessaria al ci- 
clo litico. 


portamento ha un suo senso, infatti in cellule che si trovano in carenza nutrizio- 
nale ci sono meno dei componenti necessari per l'assemblaggio di nuove parti- 
celle virali. 

Il ciclo litico è caratterizzato da una serie di eventi trascrizionali che producono 
diverse proteine necessarie per la replicazione del DNA fagico e per la produzione 
di nuove particelle fagiche. 


* Trascrizione precoce (early). Si ha trascrizione dei geni N e cro. Questi eventi 
sono repressi dal prodotto del gene c/, ed in cellule lisogene, tale repressione co- 
stituisce la base dell’immunità alla superinfezione. 


* Trascrizione precoce ritardata (delayed early). La proteina N lega I’ RNA poli- 
merasi batterica e promuove la trascrizione dei geni fagici implicati nella repli- 
cazione del DNA. 


* Replicazione. Inizialmente la replicazione procede da una singola origine di re- 
plicazione. Più avanti la replicazione procede attraverso un meccanismo a cir- 
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colo rotante (rolling circle) producendo lunghi concatameri di molecole di DNA 
fagico connesse tra loro ai siti cos. 


e Trascrizione tardiva (late). Il prodotto del gene cro si accumula fino ad un li- 
vello critico e poi blocca la trascrizione early. Il prodotto del gene Q attiva la 
trascrizione tardiva, inducendo la produzione delle proteine necessarie per la te- 
sta e la coda delle particelle fagiche mature e delle proteine responsabili della 
lisi della cellula batterica. 


Infine, l'assemblaggio del fago avviene quando un’unità di lunghezza di DNA è in- 
serita nella testa assemblata mediante il taglio del concatamero di DNA ai siti cos. 
A questo punto viene aggiunta la coda e la particella fagica matura è completa. In 
seguito alla lisi cellulare, circa 100 nuove particelle fagiche vengono rilasciate da 
un'unica cellula batterica infettata. 

Il DNA di A selvatico contiene pochi siti unici riconosciuti da enzimi di re- 
strizione che possono essere utilizzati per il clonaggio di frammenti di DNA 
esogeno: questo fa sì che À non sia totalmente adatto come vettore per il trasfe- 
rimento di tali sequenze. Inoltre, l’impacchettamento del DNA nel fago 4 è li- 
mitato dalla dimensione del DNA stesso; esso è infatti efficiente solo con fram- 
menti di DNA di dimensioni comprese tra il 78 ed il 105 percento del genoma 
selvatico (37-51 kbp). Questi limiti pongono grosse restrizioni sulla dimensione 
del DNA che può essere clonato nel genoma fagico. Due sviluppi importanti 
suggerirono d’altra parte che À potesse essere utilizzabile come vettore di clo- 
naggio. Innanzitutto, fu dimostrato che le sequenze codificanti i prodotti genici 
necessari per la ricombinazione possono essere rimosse dal genoma fagico 
senza alterare il ciclo litico che può comunque procedere formando placche di 
lisi. Il DNA rimanente, spesso definito come il braccio destro e il braccio sinistro 
del genoma di À, è in grado di fornire tutte le funzioni necessarie per lo svolgi- 
mento del ciclo litico. In secondo luogo, siti di restrizione naturali presenti nel 
genoma fagico possono essere eliminati senza causare perdita di funzione genica; 
questo ha permesso di sviluppare vettori contenenti siti unici utili per clonare 
DNA esogeno. 

È stato così possibile costruire vettori A privi dei geni necessari per la ricom- 
binazione, e che quindi possono solo effetttare ciclo litico, ma capaci di conte- 
nere inserti di DNA esogeno molto più lunghi. Sono stati sviluppati due tipi di 
vettori À: 


* vettore con inserzione — il DNA viene inserito in un sito di restrizione speci- 
fico; 

* vettore con sostituzione — il DNA esogeno sostituisce un pezzo di DNA del vet- 
tore (stuffer). 
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Il vantaggio dei vettori con sostituzione è che sono in grado di contenere inserti di 
DNA più lunghi. Per esempio, AEMBLA è un vettore da 42 kbp che contiene 14 
kbp di DNA stuffer tra le braccia destra e sinistra di Z. La ligazione delle sole brac- 
cia di À porterebbe ad un genoma fagico di appena 28 kbp. Questo è troppo corto 
per essere impacchettato nella particella di À. L'inserzione di DNA esogeno tra le 
due braccia di À porta il genoma ad una dimensione adatta ad essere impacchettato. 
Questo limite sulla dimensione di DNA impacchettabile consente a AEMBLA di 
contenere frammenti di DNA esogeno lunghi fino a circa 23 kbp (Figura 3.12). 
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Figura 3.12. Vettori 7 con inserzione o sostituzione. Tutti i vettori A mancano delle regioni non es- 
senziali per il ciclo litico, che vengono eliminate per aumentare la dimensione del frammento di DNA 
esogeno che verrà impacchettato nella particella fagica. In figura sono mostrati due vettori con inser- 
zione. Agt10 contiene un sito di restrizione EcoRI unico, nel gene c/. Fagi ricombinanti formano plac- 
che chiare invece che placche torbide. AZAPII contiene un sito di clonaggio multiplo (MCS) nel gene 
lacZ’ e i ricombinanti sono identificabili utilizzando lo screening blu-bianco. Nel caso dei vettori con 
sostituzione, i ricombinanti sono gli unici fagi che crescono; se le due braccia di X vengono legate in 
assenza del frammento esogeno, la molecola di DNA risultante è troppo piccola per essere impac- 
chettata. 
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La limitazione sulla dimensione di impacchettamento di 4 fornisce un sistema per 
assicurarsi che il DNA esogeno sia stato inserito tra le due braccia di À formando 
un fago ricombinante. Numerose altre strategie sono disponibili per identificare 
fagi À ricombinanti. 


* Inattivazione del gene cI. Diversi vettori À (es. Agt11) hanno siti di restri- 
zione unici all’interno del gene c/. Fagi nei quali il gene c/ sia stato interrotto 
dall’inserzione di DNA esogeno mostrano un’alterata morfologia di placca, 
che appare “chiara” invece di torbida. Lo screening basato su questa diffe- 
renza è tecnicamente difficile e richiede una notevole capacità da parte dell’o- 
peratore. 


* Screening blu-bianco. Sono stati prodotti vettori À (es. AZAP) contenenti il gene 
lacZ’, che esprime l’a-peptide della B-galattosidasi. L’identificazione dei fagi ri- 
combinanti può quindi essere effettuata in cellule di E. coli che esprimono il fram- 
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Figura 3.13. Impacchettamento in vitro di particelle di fago Z. Due 4 lisogeni differenti vengono utiliz- 
zati per produrre i diversi componenti necessari per l’impacchettamento delle particelle di 2. Uno dei 
due lisogeni (BHB2688) ha un gene E difettivo, che risulta nella mancata produzione delle teste. L'al- 
tro (BHB2960) ha un gene D mutato, risultando difettivo nell’impacchettamento del DNA. Mescolando 
i lisati cellulari dei due lisogeni, si ottiene un estratto capace di impacchettare i concatameri di DNA 
di 4. Il DNA multimerico (37-51 kbp) viene tagliato ai siti cos ed impacchettato in una particella di 7 
matura. 
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mento © della B-galattosidasi, in maniera simile a quella utilizzata per l’identifi- 
cazione di plasmidi pUC ricombinanti. 


Dopo aver costruito un genoma di À ricombinante, sorge il problema di come inse- 
rirlo in una particella virale, così che sia replicato in cellule di E. coli (Figura 3.13). 
Il normale impacchettamento in vivo del DNA di 4 implica l'assemblaggio di pre- 
teste, strutture composte dalla proteina più abbondante del capside, codificata dal 
gene E. Un’unità di lunghezza di DNA di À viene generata tagliando concatameri di 
genomi di À ai siti cos, mentre viene inserita nella pre-testa. La proteina del capside 
D, minoritaria, viene quindi inserita nella pre-testa, completando la maturazione 
della testa. I prodotti di altri geni servono come proteine di assemblaggio ed assicu- 
rano l’unione tra le code e le teste complete. Il genoma di vettori À ricombinanti 
può essere effettuato in vitro utilizzando due ceppi di £. coli che portano fagi À liso- 
geni contenenti difetti diversi nel processo di impacchettamento. Un difetto nella 
produzione della proteina E, dovuta ad una mutazione introdotta nel gene E, pre- 
viene la formazione delle pre-teste nel ceppo BHB2688. Nel ceppo BHB2690, una 
mutazione nel gene D previene la maturazione delle pre-teste, contenenti il DNA, in 
teste complete. Mescolando però i lisati di BHB2688 e di BHB2690, si complemen- 
tano tra loro queste deficienze e si ottengono tutti i componenti necessari per il cor- 
retto impacchettamento (Figura 3.13). Di conseguenza, genomi di À ricombinanti 
possono essere costruiti in vitro ed impacchettati in particelle di fago 4 mature, 
prima di essere propagate e replicate in cellule di £. coli. 


3.4 Vettori cosmidici 


L’unica richiesta per l’impacchettamento in vitro di DNA in un fago 4 è la pre- 
senza di due siti cos separati da una sequenza di 37-51 kbp. I cosmidi furono svi- 
luppati in seguito a questa osservazione; sono semplicemente plasmidi che conten- 
gono il sito cos di À (Collins e Briining, 1978). La Figura 3.14 mostra la struttura 
generale di un vettore cosmidico e lo schema di clonaggio per l'inserzione di DNA 
esogeno. I cosmidi, come i plasmidi, contengono un’origine di replicazione ed un 
marcatore selettivo e posseggono, inoltre, un sito di restrizione unico, nel quale 
possono essere inseriti frammenti di DNA. Dopo la reazione di impacchettamento, 
le nuove particelle À vengono usate per infettare cellule di E. coli. Il DNA viene 
iniettato nel batterio, come nel caso del normale DNA di 4, e circolarizza grazie 
alla complementarietà delle estremità cos. La mancanza di altre sequenze di 4 si- 
gnifica, però, che l'infezione non può procedere oltre questo stadio. Il DNA circo- 
larizzato sarà, comunque, mantenuto nella cellula di E. coli come plasmide. La se- 
lezione dei trasformanti sarà perciò basata sulla resistenza ad antibiotici e si forme- 
ranno colonie batteriche (invece di placche) che contengono il cosmide ricombi- 
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Figura 3.14. Clonaggio con un vettore cosmidico. Sono mostrate la struttura generale di un vettore 
cosmidico, pJB8, ed uno schema per l’inserzione di DNA esogeno nello stesso vettore. Poiché i co- 
smidi sono privi di altri geni di X, quando il DNA si trova nelle cellule di E. coli viene mantenuto come 
plasmide e viene selezionato sulla base della resistenza ad un antibiotico. 


nante. Poiché le particelle di fago À possono contenere tra 37 e 51 kbp di DNA, e 
la maggior parte dei cosmidi hanno una dimensione di circa 5 kbp, in questi vettori 
è possibile clonare frammenti di DNA lunghi tra 32 e 47 kbp. Questo rappresenta 
decisamente più di quanto possa essere clonato in un vettore À. 
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I cosmidi, come i plasmidi, sono molto stabili, ma l’inserzione di lunghi 
frammenti di DNA può rendere difficile il mantenimento dei cosmidi in una cel- 
lula batterica. Sequenze di DNA ripetute sono comuni nel DNA eucariotico e 
riarrangiamenti del DNA possono avvenire mediante ricombinazione tra le se- 
quenze ripetute presenti nel DNA clonato nel cosmide. La più grossa difficoltà 
lavorando con i cosmidi consiste nel produrre frammenti di DNA lineari nei 
quali il cosmide e l'inserto sono concatamerizzati tra loro. Esistono due problemi 
fondamentali. 


* Reazioni di ligazione tra cosmide ed inserto di DNA, come quelle mostrate in 
Figura 3.14, risulteranno nella produzione di molecole di DNA circolari che non 
possono essere utilizzate per la reazione d’ impacchettamento in vitro. 


* Più di una molecola di inserto può essere legata ad una molecola di DNA cosmi- 
dico e questo può fornire una falsa immagine dell’organizzazione del DNA del- 
l’inserto. 


Queste difficoltà possono essere superate tagliando il cosmide con due enzimi di 
restrizione diversi, generando un'estremità destra ed una sinistra che non possono 
essere legate tra loro (Ish-Horowicz and Burke, 1981). Il trattamento dell’inserto di 
DNA con fosfatasi, garantisce che inserti multipli non vengano legati al DNA co- 
smidico (vedi Capitolo 2). 


3.5 Vettori M13 


M13, ed i suoi parenti vicini fl ed fd, sono batteriofagi filamentosi di £. coli. 
M13 è un fago lisogenico maschio-specifico, con un DNA genomico circolare a 
singolo filamento lungo 6.407 bp (Figura 3.15). Le particelle di fago M13 
hanno dimensioni di circa 900 nm x 9 nm e contengono una molecola di DNA cir- 
colare a singolo filamento (denominata elica +). M13 infetta batteri che hanno il 
pilo F. Un’estremità della particella fagica si adsorbe al pilo F ed il DNA del fago 
entra nel batterio (Figura 3.16). Rapidamente, il DNA a singolo filamento viene 
convertito in DNA a doppia elica (forma replicativa, RF) mediante la sintesi di 
un'elica di DNA complementare (elica —), effettuata dalla DNA polimerasi batte- 
rica. La forma RF del genoma fagico viene moltiplicata rapidamente, fino a che 
nella cellula batterica sono presenti circa 100 molecole RF. La trascrizione dei geni 
virali produce le proteine richieste per l'assemblaggio di nuove particelle virali. La 
produzione di una proteina virale che lega il DNA a singolo filamento (il prodotto 
del gene 2), infine, forza la replicazione asimmetrica della forma RF. Questo fa sì 
che solo un filamento del DNA virale (l’elica +) sia sintetizzata. Le molecole di 
DNA a singolo filamento vengono assemblate in nuove particelle virali e vengono 
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Figura 3.15. | genomi di M13 selvatico e di un suo derivato ingegnerizzato, M13mp18. ll genoma di 
M13 selvatico contiene 10 moduli di lettura aperti (open reading frames) che sono tutti trascritti in 
senso orario. La replicazione del genoma comincia, in maniera bidirezionale, da una sequenza spe- 
cifica situata tra i geni 2 e 4. M13mp18 in più contiene il gene /acZ’ per lo screening blu-bianco dei 
ricombinanti. Un sito di clonaggio multiplo (MCS) è inserito in questo gene e fornisce diversi siti di 
restrizione unici utili per il clonaggio di frammenti di DNA esogeno nel vettore. Le mappe mostrate 
rappresentano la forma a doppia elica o forma replicativa (RF) del vettore, che è quella presente 
nella cellula ospite di E. coli. Le particelle virali contengono solo un singolo filamento di DNA. 


rilasciate dalla cellula, senza che vi sia lisi cellulare. Fino a 1.000 particelle fagi- 
che possono essere rilasciate nel mezzo ad ogni generazione cellulare. L’infe- 
zione da parte del fago M13 non causa la morte della cellula batterica e, di conse- 
guenza, le placche sono torbide. Le cellule di E. coli attorno al sito d’infezione 
non vengono uccise, ma crescono più lentamente a causa del carico metabolico 
imposto dalla produzione di particelle fagiche. L'origine di replicazione di M13 
(chiamata fl ori) contiene due sequenze distinte, ma sovrapposte implicate nel 
controllo della sintesi del DNA. Questi siti, l’iniziatore fl ed il terminatore fl, in- 
dicano l’inizio e la fine della replicazione del DNA. L’iniziatore è riconosciuto 
dalla proteina prodotta dal gene 2, che incide l'elica + nel DNA in forma RF. 
L’incisione segnala la posizione dalla quale comincerà la replicazione unidirezio- 
nale a circolo rotante. L’elica + neo-sintetizzata viene tagliata al sito terminatore, 
ancora per opera della proteina prodotta dal gene 2. Dopo il taglio, le due estre- 
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mità dell’elica + vengono legate a formare un genoma circolare a singolo fila- 
mento. 

Il passaggio tra la forma RF a doppia elica e quella a singola elica + tipica del 
genoma di M13, ha fatto di questo virus un candidato ideale per l’utilizzo come 
vettore. Come vedremo nei capitoli successivi, il DNA a singolo filamento pro- 
dotto nella particella fagica ha portato a notevoli avanzamenti nella mutagenesi in 
vitro (Capitolo 7) e nel sequenziamento del DNA (Capitolo 8). A differenza di À, 
M13 non contiene una regione non essenziale che può essere eliminata prima del- 
l'inserzione del DNA esogeno. Comunque, esiste una regione intergenica tra l’ori- 
gine di replicazione e il gene 2 (Figura 3.15) nella quale si possono inserire fram- 
menti di DNA esogeno. Vettori M13 furono sviluppati alla fine degli anni °70, 
quando il gene /acZ’ (codificante per l’& peptide della B-galattosidasi) venne inse- 
rito nel genoma di M13 (Messing et al. 1977). In seguito, furono ingegnerizzati in 
M13 lo stesso polylinker e l'x peptide dei plasmidi della serie pUC, e i siti di rico- 
noscimento per enzimi di restrizione, presenti naturalmente nel genoma di M13, 
furono eliminati (Yanisch-Perron, Vieira and Messing, 1985; Norrander, Kempe 
and Messing, 1983). La forma RF dei vettori M13 può essere isolata mediante pro- 
cedure standard di preparazione di DNA plasmidico e il DNA esogeno può essere 
inserito come se si trattasse di plasmidi convenzionali. 

I vettori M13 sono specificatamente utilizzati per la formazione di DNA a sin- 
golo filamento. Dopo che il DNA esogeno è stato clonato in M13, è possibile iso- 
lare facilmente grosse quantità di forma a singola elica dalle particelle mature che 
vengono rilasciate dalle cellule di E. coli infettate. La difficoltà maggiore con vet- 
tori di questo tipo sta nel fatto che essi tendono ad essere instabili quando vengono 
inseriti frammenti di DNA che superano la dimensione di poche kilobasi (Zinder 
and Boeke, 1982). 


3.6 Fagmidi 


I fagmidi sono plasmidi che contengono l’origine di replicazione del fago fl, per la 
produzione di DNA a singola elica. I fagmidi sono generalmente plasmidi piccoli, 
così da poter contenere inserti di DNA più grandi che non i vettori basati su M13. I 


Figura 3.16. Il ciclo vitale di M13. Il genoma di M13, a singolo filamento, è rinchiuso dalle proteine di 
copertura. L'infezione batterica avviene quando la particella fagica si attacca al pilo ed il DNA a sin- 
gola elica viene iniettato nell’ospite. Il DNA è immediatamente convertito nella forma a doppia elica 
ed è replicato e trascritto per produrre proteine virali. accumulo di proteina virale prodotta dal gene 
2 forza la replicazione asimmetrica e la produzione di molecole di DNA a singolo filamento. Queste 
molecole vengono impacchettate in particelle virali, che sono secrete dal batterio senza che avvenga 
lisi cellulare. 
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fagmidi furono originariamente sviluppati all’inizio degli anni ‘80, quando si sta- 
bilì che l'origine di replicazione f1 poteva essere clonata in pBR322 per ottenere la 
produzione di DNA a singola elica (Dotto and Horiuchi, 1981; Dotto, Enea and 
Zinder, 1981). L'origine di replicazione fl non era sufficiente per dirigere la produ- 
zione di DNA a singolo filamento, ma se un batterio contenente un fagmide veniva 
superinfettato con un M13 selvatico e funzionale o con un fago helper fl, allora si 
otteneva produzione di DNA a singola elica. Il DNA fagmidico a singolo filamento 
veniva impacchettato in particelle virali e secreto nel mezzo circostante allo stesso 
modo delle particelle di M13. Inoltre, si osservò che clonando l’origine fl nel- 
l'orientamento opposto si poteva ottenere la produzione dell’elica di DNA comple- 
mentare (Dente, Cesareni e Cortese, 1983). Così, era possibile produrre il DNA a 
singolo filamento rappresentante ciascuna delle due eliche del frammento di inte- 
resse, dopo averlo clonato nel fagmide appropriato. I fagmidi hanno il vantaggio 
che, in assenza del fago helper, è possibile isolarne il DNA a doppio filamento 
come se fosse un plasmide. Inoltre, poiché il vettore non necessita di ulteriori geni 
fagici, la sua dimensione è ridotta ed è possibile inserirvi frammenti di DNA di di- 
mensioni maggiori. 

Sono stati sviluppati altri fagmidi che traggono vantaggio da diversi aspetti dei 
plasmidi, fago À e fago M13. Abbiamo già visto che l’origine di replicazione fl è 
composta da un iniziatore ed un terminatore. Nel genoma del fago M13 selvatico 
queste sequenze sono sovrapposte, così che la replicazione inizia e poi termina 
dopo che l’intero genoma circolare è stato duplicato. Gli elementi iniziatore e ter- 
minatore possono essere separati tra loro per fornire i siti di inizio e terminazione 
per la replicazione di una molecola di DNA lineare. È stato costruito un vettore 
ad inserzione, AZAP, in modo che le braccia destra e sinistra siano connesse me- 
diante una sequenza di DNA fagmidica che comincia con un iniziatore f1 e finisce 
con un terminatore fl (Short et a/., 1988). Questo vettore (mostrato in Figura 3.17) 
ha la capacità di funzionare come un fago 4, ad esempio per la costruzione di una 
libreria di cDNA. Il DNA esogeno può anche essere escisso dal fago 4 in forma 
plasmidica, dopo superinfezione con un fago M13 selvatico. AZAP contiene tutte 
le sequenze di À necessarie per il ciclo litico e, in mezzo a queste, ci sono le se- 
quenze necessarie per la replicazione plasmidica e la selezione (ColEl ori e 
AMP®). Inoltre, AZAP contiene il gene /acZ’ ed un sito di clonaggio multiplo, si- 
mili a quelli dei plasmidi pUC. La sequenza plasmidica del vettore comincia con 
l’iniziatore fl e finisce con il terminatore fl. Vettori che contengono DNA esogeno 
possono essere selezionati con uno screening blu-bianco delle placche di A, e l’in- 
serto di DNA può essere isolato in forma plasmidica quando i batteri che ospitano 
il fago vengono superinfettati con un fago fl helper. Le proteine prodotte dal fago 
helper indurranno la replicazione del DNA contenuto tra l’iniziatore fl ed il termi- 
natore fl. Il DNA a singola elica circolarizzerà e verrà impacchettato come un fago 
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Figura 3.17. Escissione in vivo di DNA fagmidico da un vettore fagico di tipo A. AZAPII è un vettore 
fagico di tipo A sofisticato, contenente gli elementi dei fagi A ed M13 oltre alle sequenza necessarie 
per la produzione stabile di fagmide. La sequenza di DNA dell'intero fagmide pBluescript è posizio- 
nata nel vettore 4 tra l’iniziatore f1 ed il terminatore f1. DNA esogeno inserito nel sito di clonaggio 
multiplo (MCS) di AZAPII può essere recuperato sotto forma di fagmide. | batteri che ospitano il fago 
A vengono superinfettati con un fago basato su M13 per indurre la replicazione delle sequenza com- 
prese tra i siti iniziatore e terminatore di f1. | fagi M13 prodotti utilizzando questo DNA possono 
essere usati per infettare cellule F' di E. coli ed ottenere DNA plasmidico a doppia elica. 


tipo M13 e secreto dalla cellula. L'introduzione di particelle fagiche M13 in un 
ceppo di E. coli F' e la selezione su ampicillina risulterà nella formazione di colo- 
nie che contengono il plasmide ricombinante, che potrà poi essere isolato come 


plasmide a doppia elica. 
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3.7 Cromosomi artificiali 


La maggiore limitazione della maggior parte dei vettori discussi finora è la dimen- 
sione del DNA che può essere clonato al loro interno. I cromosomi naturali euca- 
riotici consistono in centinaia o migliaia di geni insieme a elementi di DNA neces- 
sari per la stabilità e la funzionalità cromosomica, come i telomeri ed i centro- 
meri. I telomeri, che consistono di DNA e proteine, sono localizzati alle estremità 
dei cromosomi e li proteggono dal danneggiamento. I centromeri sono segmenti al- 
tamente ripetuti di DNA che sono essenziali per il controllo della segregazione cro- 
mosomica durante la divisione cellulare. Un’ estensione logica nella produzione di 
vettori per il clonaggio di grossi frammenti di DNA è, quindi, ricostruire un cromo- 
soma a replicazione autonoma nel quale possano essere inseriti frammenti di DNA 
esogeno. Questo tipo di clonaggio è concettualmente simile al clonaggio in fago A, 
con la ricostruzione di una molecola di DNA capace di replicarsi, eccetto che la di- 
mensione del segmento di DNA esogeno che può essere clonato è molto maggiore. 


3.7.1 YACS 


I cromosomi artificiali di lievito (Yeast Artificial Chromosome; YAC) permettono il 
clonaggio, in cellule di lievito, di frammenti di DNA genomico esogeno che pos- 
sono raggiungere dimensioni di 500 kbp. Questi vettori contengono diversi ele- 
menti tipici dei cromosomi di lievito, inclusi i seguenti. 


e Un centromero di lievito (CENA). Il centromero di lievito è specificato da un 
segmento di DNA di 125 bp. La sequenza consenso consiste di tre elementi: una 
regione di 78-86 bp con oltre il 90 percento di residui AT, fiancheggiata da una 
sequenza conservata, da un lato, e da una corta sequenza consenso, dall’altro 
(riassunto da Clarke (1990). 


* Una sequenza a replicazione autonoma di lievito (ARS1). Gli elementi ARS di lie- 
vito sono essenzialmente delle origini di replicazione che funzionano in cellule di 
lievito in maniera autonoma rispetto alle origini di replicazione cromosomiche. 

* Telomeri di lievito (TEL). I telomeri sono sequenze specifiche (5*- 
TGTGGGTGTGGTG-3") che sono presenti, in copie multiple, alle estremità dei 
cromosomi e sono necessari per la completa replicazione e il mantenimento dei 
cromosomi. 

* Geni per la selezione degli YAC in lievito. Il vettore ha una copia funzionale di 
URA3, un gene implicato nella biosintesi dell’uracile, e di TRP/, un gene coin- 
volto nella biosintesi del triptofano, che consentono la selezione delle cellule di 
lievito che contengono il vettore. Lo YAC viene trasformato in cellule ospiti di- 
fettive in queste vie biosintetiche, ed i trasformanti vengono identificati per la 
loro capacità di complementare i difetti nutrizionali. 
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* Origine di replicazione batterica e marcatore selettivo batterico. Per poter pro- 
pagare il vettore YAC in cellule batteriche, prima dell’inserzione del DNA eso- 
geno, i vettori YAC generalmente contengono ColEl ori ed il gene per la resi- 
stenza all’ampicillina, per la crescita e l’analisi in E. coli. 


Il clonaggio di frammenti di DNA in uno YAC è schematizzato in Figura 3.18. Lo 
YAC è tagliato utilizzando enzimi di restrizione per produrre due “braccia”, cia- 
scuna con un telomero all’estremità. Un braccio contiene una sequenza di replica- 
zione autonoma (ARS/), un centromero (CEN4) ed un marcatore selettivo (TRP)/). 


EcoRI 


AR Eelo URA3 


TRPI 


DNA genomico 


AMPR 


ser 


aa 


BamHI BamHi 


Tagliare con Digestione parziale 
EcoRI e BamHI con EcoRI 
EcORI EcoRI 
EcoRI  ARS2 AMP® or TEL BamHi EER 
| EcoRI EcoRI 
CEN4 TRPI EcoRI EcORI 
TEL URA3 EcORI EcORI 
ug: sil Eghl ber 


Mescolare e ligare 


TEL, URA3 EcoRI EcoRI ARS2 AMP® ori JBL 
zi == i l [ = 


DNA 
genomico CENA TAPI 


| 


Trasformazione in cellule di lievito ade”, ura”, trp” 
e selezione per colonie rosse, URA*, TRP- 


Figura 3.18. Clonaggio di un grosso frammento di DNA in un vettore YAC. Vedi il testo per i dettagli. 
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L’altro braccio contiene un secondo marcatore selettivo (URA3). Grossi fram- 
menti di DNA (> 100 kbp) sono poi legati tra le due braccia (Anand, Villasante e 
Tyler-Smith, 1989). L'inserzione di DNA esogeno nel sito di clonaggio inattiva il 
gene tRNA soppressore SUP4, che si trova nel vettore e che esprime tRNA!, In 
cellule di lievito ade2-ochre, l’espressione di SUP4 risulta nella formazione di co- 
lonie bianche, mentre se il gene è stato inattivato per inserzione dà origine a colo- 
nie rosse (Burke, Carle e Olson, 1987). Cellule di lievito mutate nel prodotto ge- 
nico di ADE2 (codificante per l’enzima fosforibosilamino-imidazolo-carbossilasi) 
sono bloccate nella via di biosintesi dell’adenina, causando l'accumulo di un in- 
termedio nel vacuolo; questo intermedio fornisce alle cellule un colore rosso. Gli 
YAC ricombinanti sono quindi trasformati in un ceppo di lievito che ha difetti 
nelle copie cromosomiche dei geni ura3, trp] e ade2. I ricombinanti vengono 
identificati come le colonie rosse che crescono in terreno privo sia di uracile che 
di triptofano. Questo assicura che la cellula contenga un cromosoma artificiale 
con entrambi i telomeri (perché entrambe le mutazioni nutrizionali sono comple- 
mentari) e che il cromosoma artificiale contenga l'inserto di DNA (perché la cel- 
lula è rossa). 


Ci sono alcune difficoltà lavorando con gli YAC. Alcune di esse sono elencate 
qui sotto. 


* Molecole di DNA molto grosse sono molto fragili e suscettibili di rottura, cau- 
sando problemi di riarrangiamento. 


e Si stima che tra il 10 ed il 60% dei cloni in librerie genomiche di YAC siano chi- 
mere, cioè regioni provenienti da parti diverse del genoma che sono unite in un 
singolo clone di YAC (Green et al., 1991). 


e I cloni tendono ad essere instabili, e gli inserti di DNA esogeno spesso vengono 
persi. Sequenze di DNA ripetute naturali sono rare nel genoma di lievito, e l’in- 
serzione di tali sequenze provenienti, ad esempio, da inserti di DNA umano, 
sembrano aumentare la frequenza di ricombinazione all’interno dello YAC. Que- 
sto potrebbe rendere lo YAC instabile. È interessante, però, che in lievito YAC 
più grossi sono più stabili di quelli più piccoli, facilitando così il clonaggio di 
lunghe regioni di DNA (Smith, Smyth e Moir, 1990). 


e Durante la crescita mitotica c'è una notevole frequenza di perdita dell’intero 
YAC. 


* È difficile separare lo YAC degli altri cromosomi dell’ospite a cause delle di- 
mensioni simili. La separazione richiede sofisticati apparati da elettoroforesi in 
gel pulsati (PFGE). 


® Quando gli YAC vengono isolati da cellule di lievito, la resa di DNA non è alta. 
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3.7.2 PACS 


Per superare alcuni dei problemi associati all’utilizzo dei cosmidi o degli YAC, è 
stato sviluppato un metodo per il clonaggio e l’impacchettamento di frammenti di 
DNA utilizzando un sistema basato sul batteriofago P1, che offre la possibilità di 
clonare frammenti di DNA genomico con dimensioni comprese tra le 70 e le 95 
kbp. Il batteriofago P1 ha un genoma molto più grande del fago 4 (circa 110-115 
kbp); sono stati sviluppati vettori con i componenti essenziali per la replicazione 
di P1 inseriti in un plasmide (Ioannau et al., 1994). Dopo aver infettato £. coli, il 
batteriofago P1 può esprimere le proprie funzioni litiche, producendo 100-200 
nuove particelle fagiche e lisando il batterio infettato. In alternativa, il batterio- 
fago può reprimere le proprie funzioni litiche, ed il genoma fagico viene mante- 
nuto come un grosso plasmide stabile in basso numero di copie. Il fago P1 pos- 
siede due origini di replicazione, una per controllare la replicazione litica, e l’altra 
per mantenere il plasmide durante la crescita non litica. Durante il ciclo litico, 
viene prodotto nuovo DNA fagico che viene tagliato ad un sito pac prima dell’in- 
serzione nelle particelle virali. 

Il clonaggio di frammenti di DNA esogeno in un vettore P1, o P1 artificial 
chromosome (PAC), è mostrato in Figura 3.19. Il vettore PAC è digerito con gli 
enzimi di restrizione Scal e BamHI per generare due braccia del vettore: un brac- 
cio corto ed uno lungo. Il DNA genomico viene digerito parzialmente con MboI 
(riconosce la sequenza 5°'-GTAC-3”, producendo estremità appiccicose compatibili 
con BamHI) e selezionato in base alle dimensioni su un gradiente di saccarosio. 
Frammenti di lunghezza compresa tra le 70 e le 95 kbp sono isolati e legati tra le 
braccia del vettore generando una serie di molecole lineari. Se la ligazione avviene 
tra le due braccia corte, la molecola risultante non conterrà alcuna origine di repli- 
cazione di PI e neanche il gene KANR, e non darà origine a cloni vitali. Se en- 
trambe le braccia sono lunghe, non ci sarà il sito pac e non avverrà l’impacchetta- 
mento nella testa del fago. L'unico ricombinante vitale consisterà nella sequenza 
inserto fiancheggiata da un braccio lungo ed uno corto. Il fago P1 utilizza una stra- 
tegia di impacchettamento “a testa piena” e può ospitare una lunghezza totale di 
DNA di circa 100-115 kbp. Ciò significa che qualunque inserto più lungo di 95- 
100 kbp risulterà nel taglio della molecola impacchettata prima che entrambi i siti 
loxP siano inseriti nel fago, e la molecola non sarà in grado di circolarizzare dopo 
la trasfezione nell’ospite. Una volta iniettato in cellule di E. coli cre* il DNA 
viene circolarizzato ai siti /oxP grazie all'intervento della proteina Cre e replica 
utilizzando l’origine di replicazione plasmidica. Il sito di restrizione BamHI origi- 
nale, nel quale viene clonato il DNA esogeno, si trova all’interno del gene batte- 
rico sacB (codificante per la levansucrasi). L'espressione di tale gene è tossica per 
cellule di E. coli cresciute in saccarosio. Quindi il saccarosio fornisce un sistema 
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Figura 3.19. Clonaggio in un vettore PAC. Il vettore PAC contiene i repliconi plasmidico e litico del 
batteriofago P1, assieme ad un sito di taglio pac per consentire l'assemblaggio del DNA in particelle 
fagiche. Inoltre, il vettore contiene l'origine di replicazione di pUC (ori) ed il gene per la resistenza 
all’ampicillina, necessari per la propagazione e la selezione del vettore stesso. Queste sequenza 
vengono perse nel PAC ricombinante. Grossi inserti di DNA possono essere clonati nel gene sacB 
(la cui funzione può essere contro-selezionata) ed impacchettati in vitro in particelle fagiche P1. La 
transfezione delle particelle fagiche P1 in cellule di E. coli che contengono una copia della Cre ri- 
combinasi risulterà nella circolarizzazione del PAC ricombinante ai siti /oxP. La forma circolare è poi 
mantenuta in basso numero di copie utilizzando il replicone plasmidico di P1. 
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di selezione positiva per i PAC che contengono l’inserto. La propagazione su sac- 
carosio di cellule di E. coli che ospitano PAC ricombinanti permette la crescita di 
colonie contenenti l'inserto. 

I PAC ricombinanti sono mantenuti come plasmidi in £. coli utilizzando la re- 
sistenza alla kanamicina come marcatore selettivo. Il numero di copie plasmidiche 
può essere aumentato più di 25 volte inducendo, con isopropil-B-D-tiogalattopira- 
noside (IPTG), il replicone litico di P1, controllato da un promotore /ac, che si 
trova nel PAC ricombinante (Pierce et al., 1992). Le molecole di DNA ricombi- 
nanti vengono poi isolate come plasmidi usando metodi tradizionali. 

Utilizzando il sistema di impacchettamento di PI, si può facilmente clonare e 
manipolare DNA genomico compreso tra le 70 e le 95 kbp. Miglioramenti nella 
progettazione dei vettori hanno permesso la produzione di PAC che possono ospi- 
tare inserti di 130-150 kbp. I vantaggi maggiori del metodo di impacchettamento 
del fago PI rispetto ad altri metodi di clonaggio sono: 


e la grossa dimensione dei frammenti di DNA che possono essere inseriti nei 
vettori; 


* non avviene alcun riarrangiamento o delezione di DNA metilato grazie all’uti- 
lizzo di ceppi restrizione-meno; 


e il DNA ricombinante si recupera facilmente come plasmidi per ulteriori screening 
o manipolazioni. 


3.7.3 BACS 


I cromosomi artificiali batterici (BACS), sono versioni ingegnerizzate di plasmidi 
F' (Shizuya et al., 1992). I BAC possono contenere circa 200 kbp di DNA eso- 
geno, e l’origine di replicazione del fattore F (oriS) mantiene il loro livello a 
circa una copia per cellula. Oltre ad oriS, i BAC contengono quattro geni del fat- 
tore F necessari per la replicazione ed il mantenimento del numero di copie, 
repE, parA, parB e parC. L'architettura generale di un tipico BAC è mostrata in 
Figura 3.20. 

Oltre ai geni del fattore F, pBeloBac11 contiene anche un marcatore selettivo 
che conferisce resistenza ad un antibiotico (CAM®) ed il gene /acZ’ che contiene 
un sito di clonaggio multiplo per lo screening blu-bianco dei BAC contenenti l’in- 
serto (Kim et al., 1996b). Inoltre, i BAC contengono un sito cos di Z (cosN) ed un 
sito /oxP. Questi siti sono utilizzati per il taglio specifico del BAC contenente l’in- 
serto durante la mappatura per restrizione. Il sito cosN può essere tagliato utiliz- 
zando la terminasi di À (Rackwitz et al., 1985), mentre il sito /oxP può essere ta- 
gliato dalla proteina Cre in presenza di un oligonucleotide contenente la sequenza 
loxP (Abremski, Hoess e Stanbers, 1983). Sono stati costruiti altri BAC che con- 
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Figura 3.20. La struttura di un vettore BAC. Vedi il testo per i dettagli. 


tengono siti di riconoscimento per enzimi di restrizione che tagliano molto rara- 
mente. Per esempio, I-Scel è un enzima di restrizione codificato in un introne del 
mitocondrio del lievito Saccharomyces cerevisiae (Monteilhet et al., 1990). La sua 
lunga sequenza di riconoscimento (5’--TAGGGATAACAGGGTAAT-3°) non com- 
pare neanche una volta nel genoma umano ed è quindi molto utile per linearizzare 
il vettore senza tagliare l'inserto di DNA esogeno. 

Il DNA inserito in un BAC è molto stabile. Può restare intatto per diverse 
centinaia di generazioni in cellule di E. coli e, quando mantenuto in cellule di £. 
coli difettive nella ricombinazione, sembra essere meno suscettibile a riarrangia- 
menti e delezioni. Il maggiore limite all’utilizzo dei BAC è che essi sono pre- 
senti solo in una 0 due copie per cellula; questo può complicare l'isolamento e lo 
screening. 


3.7.4 HACS 


Sono stati costruiti cromosomi artificiali umani (HACS), che possono sopravvivere 
per periodi lunghi in cellule in coltura (Harrington er al., 1997) (Figura 3.21). 
come abbiamo già detto, la stabilità dei cromosomi lineari necessita di tre elementi 
— centromeri, telomeri ed un’origine di replicazione. La sequenza ripetuta telome- 
rica umana (5°-TTAGGG-3°) è ben conosciuta, ma è diversa dalla sua controparte 
in lievito e le due non sono interscambiabili. Uno YAC non funziona come un cro- 
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Figura 3.21. Un cromosoma umano artificiale in cellule in coltura. Un minicromosoma contenente a 
satellite sintetico è stato formato per transfezione di DNA « satellite e sequenza telomeriche in 
cellule in coltura. È stata isolata una linea clonale ed è stato mostrato che contiene un HAC (indicato 
dalla freccia) derivato dal DNA transfettato e non dalla rottura di cromosomi endogeni. Riproduzione 
da Willard (2000) permessa. Copyright (2000) American Association for the Advancement of 
Science. 


mosoma in cellule umane. Per aiutare l'isolamento di sequenze centromeriche e di 
origini di replicazione umane, sono stati costruiti degli HAC che possono essere 
transfettati e mantenuti in cellule umane (Henning et al., 1999). Questo approccio 
ha identificato ripetizioni multiple di una sequenza di 171 bp (chiamata la ripeti- 
zione del satellite @), contenuta in un frammento di 3 milioni bp del cromosoma X 
umano, che funziona da centromero (Schueler e? a/., 2001). La natura ripetitiva di 
queste sequenza fa sì che siano difficili da studiare e rende ardua l’identificazione 
del centromero stesso. 

Il genoma umano contiene origini di replicazione multiple. Mediamente un 
cromosoma umano contiene circa 150 x 10° bp di DNA, mentre la DNA polime- 
rasi replica al massimo 3000 bp al minuto. Se la replicazione iniziasse da un sito 
unico, ci vorrebbe circa un mese per replicare ciascun cromosoma, invece di 
un’ora, che è il tempo effettivamente necessario. Origini di replicazione multiple 
significa che in un cromosoma eucariotico ci sono diverse regioni dalle quali può 
avere inizio la replicazione, e che il processo replicativo procede ad una velocità 
molto maggiore. La sequenza delle origini di replicazione umane è molto degene- 
rata (Vashee et al., 2001), ma lo sviluppo degli HAC dovrebbe consentire una map- 
patura più precisa di queste regioni. 
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Gli HAC hanno un grosso potenziale come strumenti per la ricerca di base e la 

= . . . . . . . 
terapia medica. I cromosomi artificiali potrebbero alla fine portare a vettori per la 
terapia genica (vedi Capitolo13) con diversi vantaggi rispetto ai vettori virali esi- 
stenti. 


e Esistono come elementi extracromosomici e quindi non causano mutagenesi in- 
serzionale. 


e Non dovrebbero avere limiti rispetto alla dimensione del DNA che possono con- 
tenere. 


e Grazie alle differenze di comportamento del centromero in mitosi ed in meiosi, 
potrebbero essere progettati in modo da non funzionare nella linea germinale. 


* Queste possibilità sono per il futuro e dipendono dall’acquisire molte più cono- 
scenze di quante sono attualmente disponibili sul funzionamento dei cromosomi. 


Reazione a catena 
della polimerasi (PCR) 


Concetti chiave 


* La PCRè l'amplificazione in vitro di sequenze specifiche di DNA 


* La PCR richiede due primer — ciascuno complementare ad una delle 
due eliche di DNA — ed una DNA polimerasi 


+ Cicli ripetuti di riscaldamento e raffreddamento amplificano il DNA tra 
i siti di legame dei due primer, producendo grandi quantità di DNA 
replicato 


È ragionevole sostenere che, fin dalla sua concezione, a metà degli anni ’80 (Saiki er 
al., 1985: Mullis e Faloona, 1987), l'impatto della reazione a catena della polimerasi 
(Polymerase Chain Reaction = PCR) sulla biologia molecolare, la scienza forense e la 
diagnosi di malattie genetiche umane è stato immenso. Il processo in sé è una mera 
estensione delle proprietà della replicazione del DNA, ma è stato utilizzato in molti 
modi differenti per rendere più semplice e, in molti casi per la prima volta possibile, il 
clonaggio e la manipolazione del DNA. In termini semplici, la PCR è la copiatura ri- 
petitiva di una regione di DNA a doppia elica. Il processo è mostrato schematicamente 
in Figura 4.1. La potenza della PCR deriva dalla sua capacità di replicare grandi quan- 
tità di una regione specifica di DNA in un breve periodo di tempo. Al limite, la PCR è 
capace di amplificare una porzione specifica di una singola molecola di DNA in vitro 
generandone una quantità sufficiente per essere clonata, sequenziata, analizzata me- 
diante mappe di restrizione, etc. L'impatto della PCR fu messo in risalto nel 1993 con 
l'assegnazione a Kary Mullis del premio Nobel per la chimica, per i suoi contributi 
allo sviluppo della procedura. Mullis ha raccontato la sua eccitante scoperta (Mullis, 
1990), ed una sua interessante biografia può essere trovata sul sito Web del premio 
Nobel (http://www.nobel.se/chemistry/laureates/1993/mullis-autobio.htm]). 

La PCR richiede due primer oligonucleotidici, generalmente di lunghezza tra 17 
e 30 nucleotidi, che fiancheggiano la sequenza di DNA che si vuole amplificare. 
Uno dei primer ha la stessa sequenza di un filamento del DNA (diciamo l’elica 
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Figura 4.1. | passaggi in un esperimento di PCR. | due filamenti di DNA della molecola di DNA da 
amplificare, mostrati in rosso e blu per differenziarli, sono denaturati, o separati mediante riscalda- 
mento. Le regioni a forma di riquadri indicano sequenze uniche nel DNA da amplificare, alle quali si 
legano i primer oligonucleotidici. Quando le eliche sono separate, vengono raffreddate in presenza 
degli oligonucleotidi complementari a ciascuna elica. Questo permette l’appaiamento degli oligonu- 
cleotidi alle loro sequenze di DNA complementari. Gli oligonucleotidi sono progettati in modo che le 
estremità 3’ siano affacciate tra loro. Gli oligonucleotidi vengono poi allungati utilizzando una DNA 
polimerasi in presenza dei quattro deossiribonucleosidi trifosfato. Questo ciclo di denaturazione, 
appaiamento ed allungamento è ripetuto 20-30 volte per ottenere una grossa amplificazione del DNA 
compreso tra i siti di legame dei due oligonucleotidi. 


senso), mentre l’altro primer ha la stessa sequenza dell’altro filamento di DNA 
(l’elica antisenso). Il primer dell’elica senso si legherà all’elica antisenso, mediante 
interazione tra basi complementari, ed inizierà la sintesi di una nuova elica senso. 
In modo simile, il primer antisenso si legherà all’elica senso del DNA ed inizierà la 
sintesi di una nuova elica antisenso. La reazione di PCR è suddivisa in tre stadi di- 
stinti, ciascuno dei quali viene effettuato ad una temperatura diversa (Fig. 4.1). 
Il ciclo di denaturazione-appaiamento-estensione viene ripetuto 20-30 volte in 
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modo da raggiungere un’amplificazione soddisfacente della sequenza di DNA spe- 
cifica. I tre stadi di ciascun ciclo di PCR sono i seguenti. 


Denaturazione. Le due eliche della molecola di DNA bersaglio sono separate 
nelle due eliche singole mediante riscaldamento. Come abbiamo visto nel Ca- 
pitolo 1, il DNA può essere denaturato reversibilmente con un ciclo di riscal- 
damento e raffreddamento. Questo passaggio viene generalmente effettuato a 
94°C. 


Appaiamento. Alle due eliche bersaglio è poi consentito di raffreddarsi in pre- 
senza dei primer oligonucleotidici. Uno dei primer riconosce e si lega ad una 
delle eliche del DNA bersaglio, e l’altro primer riconosce e lega l’altra elica. I 
primer sono progettati in modo che l’estremità libera 3’ di ciascuno di essi si 
affacci su quella dell’altro, così la sintesi di DNA procede su entrambe le eli- 
che attraverso la regione compresa tra i due primer. La temperatura alla quale 
si ottiene l’appaiamento del primer al DNA stampo dipende dalla lunghezza e 
dalla sequenza del primer, e dal livello di specificità richiesto nella particolare 
reazione di PCR, in maniera simile a quanto abbiamo visto per il Southern 
blotting nel Capitolo 2. Tipicamente si sceglie una temperatura compresa tra 
45 e 60°C. 


Estensione. Una DNA polimerasi lega l’estremità libera 3’ di ciascun oligonu- 
cleotide appaiato al DNA ed utilizza ANTPSs per sintetizzare una nuova elica di 
DNA in direzione 5°-3”. Gli esperimenti di PCR iniziali utilizzavano il fram- 
mento Klenow della DNA polimerasi I come enzima replicativo ma, a causa del 
passaggio di denaturazione, bisognava aggiungere enzima fresco ad ogni ciclo. 
Un grosso miglioramento si è ottenuto con l’introduzione della Taq DNA poli- 
merasi, derivata dal batterio termofilico Thermus aquaticus (Lawyer et al., 
1989). La Taq DNA polimerasi è resistente alle alte temperature e può soppor- 
tare il passaggio di denaturazione a 94°C mantenendo completamente l’attività 
enzimatica. Ciò significa, che non c’è bisogno di ri-aggiungere l’enzima durante 
la reazione di PCR, e che i cicli di riscaldamento e raffreddamento necessari per 
la PCR possono essere completamente automatizzati utilizzando blocchi riscal- 
dati, appositamente progettati. Inoltre, la temperatura ottimale di replicazione 
della Taq DNA polimerasi è di 72°C. L'elevata temperatura alla quale può avve- 
nire la reazione di allungamento fa sì che la specificità dell’appaiamento non sia 
compromessa. 


Dopo un ciclo di PCR viene prodotta una nuova copia di ciascuna elica di DNA, 
come mostrato in Figura 4.1. Il sito d’inizio della sintesi del DNA è dettato dal le- 
game dei primer oligonucleotidici al DNA stampo. L’ibridazione specifica, attra- 
verso legami idrogeno tra le basi appaiate, posiziona in maniera specifica ciascun 
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oligonucleotide rispetto alle sequenze complementari sull’elica stampo. Quello che 
non è ovvio, invece, è come viene terminata la sintesi del DNA. Se analizziamo in 
un gel di agarosio 1 risultati di una tipica reazione di PCR, osserviamo la presenza 
di un’unica banda discreta (Fig. 4.2). Ciò suggerisce che i frammenti di DNA siano 
omogenei e che inizino e terminino allo stesso punto. Per capire come questo possa 
succedere, dobbiamo guardare i frammenti di DNA prodotti durante i diversi cicli 
di PCR (Fig. 4.3). 

Durante il primo ciclo di PCR, le due eliche del DNA stampo vengono separate 
e la sintesi del DNA comincia al sito di legame del primer. Le due eliche neo-sinte- 
tizzate alla fine del ciclo 1 (mostrate in verde in Fig. 4.3) avranno un'estremità 
5’ definita, che dipende dal sito di legame del primer, ma le estremità 3’ non sa- 
ranno ben definite. La sintesi di DNA, infatti, non termina in un punto preciso, ma 
si interrompe solo durante il passaggio di denaturazione del ciclo 2. Ciascuna mo- 
lecola di DNA presente alla fine del ciclo 1 procederà nel ciclo di PCR successivo, 


Primer 1 


Figura 4.2. Amplificazione per PCR di un gene da DNA genomico. Due primer oligonucleotidici 
sono stati progettati in modo da fiancheggiare il gene nel genoma umano. È stata effettuata una 
reazione di PCR da 25 cicli, ed 1/10 della reazione totale è stata corsa in un gel di agarosio di fianco 
ad uno standard di peso molecolare (M). Il gel è stato colorato con bromuro di etidio e fotografato in 
luce UV. 
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Figura 4.3. | prodotti formati durante i primi tre cicli di un esperimento di PCR. La molecola da 
amplificare (in rosso e blu) contiene sequenze che sono complementari ai due oligonucleotidi. Gli 
oligonucleotidi funzionano da siti di inizio per la replicazione del DNA. Tutti i prodotti di ciascun ciclo 
di PCR funzionano da stampo per la replicazione in cicli successivi. In figura sono mostrati i prodotti 
del primo ciclo di PCR (verde), del secondo ciclo (viola) e del terzo (marrone). Il completamento del 
terzo ciclo risulta nella formazione di due molecole di DNA a doppio filamento (nei riquadri) le cui 
estremità 5’ e 3’ sono identiche alle estremità dei primer oligonucleotidici. | cicli successivi produr- 
ranno un aumento esponenziale di questo tipo di molecole di DNA. 
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dove funzionerà da stampo per il legame di nuovi primer. Nel ciclo 2, si avrà il le- 
game dei primer alle eliche parentali originali ed ai filamenti sintetizzati durante il 
ciclo 1. I primer appaiati alle eliche di DNA parentali genereranno prodotti simili a 
quelli ottenuti durante il ciclo 1. Invece, il legame dei primer alle molecole sintetiz- 


Tabella 4.1. Rendimento teorico di molecole di DNA a doppia elica formate correttamente 
durante un esperimento di PCR che comincia con una molecola singola di DNA 


Ciclo 
numero 
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Molecole bersaglio 
a doppio filamento 


494 

1004 

2026 
4072 

8 166 
16356 
32738 

65 504 
131038 
262108 
524250 
1048 536 
2097110 
4194260 
8388 562 
16777168 
33554382 
67108812 
134217674 
268435400 
536870854 
1073 741 764 


Molecole a doppio 
filamento più grandi 


Numero totale 
di filamenti 
di DNA replicati 


9412 

1024 

2048 
4296 
8192 
16384 
32768 

65 536 
131072 
262 144 
524288 
1048576 
2097 152 
4194304 
8388 608 
16777216 
33554432 
67108 864 
134217728 
268435456 
536870912 
1073 741 824 
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zate durante il ciclo 1, seguito dalla replicazione, porterà alla formazione di un fila- 
mento di DNA con entrambe le estremità 5’ e 3’ definite. Ciò succede perché la re- 
plicazione del DNA termina quando non c’è più DNA stampo da copiare. Così, 
alla fine del ciclo 2, saranno state formate due eliche di DNA (mostrate in violetto) 
con entrambe le estremità 5’ e 3’ definite. Queste sono però appaiate a frammenti 
di DNA che hanno una estremità 5’ definita ed un’estremità 3’ non ben definita; 
questo DNA, prodotto nel ciclo 2 del processo di PCR, verrà utilizzato nel ciclo 3 
e, ancora, ciascuna elica di DNA verrà utilizzata come stampo per il legame dei 
primer. Alla fine del ciclo 3 ci saranno due molecole di DNA a doppia elica che 
hanno le estremità 5° e 3’ nelle posizioni corrispondenti alle regioni dello stampo 
originale alle quali i primer si sono legati. Queste corrispondono alle sequenze nei 
riquadri in Figura 4.3. 

Oltre il ciclo 3 della PCR, 1 cicli ripetuti di denaturazione, appaiamento ed 
estensione risulteranno nell’accumulazione esponenziale di frammenti definiti di 
DNA specifico (Tabella 4.1). Dopo 25 cicli, tipico per molti esperimenti di PCR, ci 
si attende un’amplificazione di circa 30 milioni di volte, ed amplificazioni di que- 
st'ordine di grandezza si ottengono effettivamente anche in pratica. Tutte le rea- 
zioni di PCR sono “contaminate” da piccole quantità di frammenti di DNA con 
estremità non correttamente definite, ma questi sono per lo più insignificanti, data 
la massiccia amplificazione di frammenti di DNA specifico. 

Ci sono diversi fattori che vanno presi in considerazione quando si tenta di am- 
plificare una sequenza specifica usando la PCR. Questi includono la scelta della 
DNA polimerasi utilizzata, il DNA stampo, le condizioni generali di reazione, e la 
sequenza dei primer oligonucleotidici. Discuteremo ora brevemente ciascuno di 
questi aspetti, con un riferimento particolare a come questi possano influenzare 
esperimenti di ingegneria genetica, ma i lettori interessati possono riferirsi ad una 
varietà di testi che trattano più in dettaglio gli aspetti pratici della PCR (McPershon 
e Mgller, 2000; Innis, Gelfland e Sninsky, 1999). 


4.1 Condizioni della reazione di PCR 


Un tipico esperimento di PCR contiene i seguenti componenti: 
e DNA (0.01-0.1 ug) 

* primer l (20 pmol) 

e primer 2 (20 pmol) 

Tris-HC] (20 mM, pH 8.0) 

MSECI, (2 mM) 
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KCI (25 mM) oppure KCI (10 mM) e (NH,),SO, (10 mM) 

* Deossinucleotidi trifosfati (50 uM ciascuno di dATP, dCTP, dGTP, dTTP) 
* DNA polimerasi termostabile (2 unità) 

e Un volume di reazione totale di 50-100 pl. 


Discuteremo in maggior dettaglio più avanti la polimerasi, il DNA stampo ed i pri- 
mer. Dei reagenti che compongono la reazione (Tris, KCI e MgCL), la concentra- 
zione degli ioni magnesio nella reazione gioca un ruolo significante nel successo 
della reazione di PCR (Fig. 4.4). Il magnesio è necessario per il funzionamento 
della DNA polimerasi, e la specificità di qualsiasi reazione di PCR dipende dalla 
concentrazione di magnesio utilizzata. A basse concentrazioni di magnesio, la rea- 
zione fallisce perché la polimerasi non è sufficientemente attiva. A concentrazioni 
di magnesio elevate, la reazione perde specificità e vengono sintetizzati prodotti 
multipli. La concentrazione ottimale di magnesio deve essere determinata in ma- 
niera empirica per ciascun set di primer, ma è generalmente compresa tra 1 e 5 
mM. Il tampone ed il sale nella reazione (Tris e KC1) sono generalmente mantenuti 
costanti, anche se in alcuni protocolli il livello di KCI viene ridotto per incorag- 
giare la DNA polimerasi a restare più a lungo sullo stampo ed ottenere l’amplifica- 
zione di prodotti più lunghi (Ford e Rose, 1994). 


mM Mg”* 
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Figura 4.4. Effetto della concentrazione di magnesio sull’efficienza e la specificità di un esperimento 
di PCR. Un esperimento di PCR è stato effettuato utilizzando diverse concentrazioni di cloruro di 
magnesio. Dopo la PCR, i prodotti sono stati separati in un gel di agarosio e colorati con bromuro 
di etidio. La dimensione dei prodotti di PCR ottenuti è stata paragonata ad uno standard di peso 
molecolare di DNA (M). Riprodotto da Critical Factors for Successful PCR con permesso di Qiagen 
GmbH. 
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Dopo che la reazione di PCR è stata assemblata, prima di essere sottoposta alle 
diverse temperature che promuovono la denaturazione, appaiamento ed estensione 
caratteristici di un ciclo di PCR, essa viene spesso coperta con uno strato di olio mi- 
nerale per prevenire l’evaporazione del campione durante il riscaldamento, in alter- 
nativa, l’evaporazione viene prevenuta utilizzando una macchina per PCR con il co- 
perchio riscaldato. Condizioni tipiche per un esperimento di PCR possono essere: 


e 94°C, 30 s — denaturazione 
* 60°C, 30 s — appaiamento 
e 72°C, 1 min- estensione. 


I passaggi di denaturazione e appaiamento sono relativamente brevi, ma sono suffi- 
cienti per consentire la rottura e la riformazione dei legami idrogeno tra le eliche 
del DNA. I primi protocolli includevano un passaggio di denaturazione iniziale 
(94°C, 2 min) per assicurare che il DNA stampo inizialmente presente fosse com- 
pletamente a singola elica. Questo oggi normalmente non si fa più perché esposi- 
zioni lunghe ad elevata temperatura inducono incisioni a singolo filamento nel 
DNA stampo. La lunghezza del prodotto di PCR amplificato detta il tempo asse- 
gnato al passaggio di estensione della reazione. La maggior parte delle polimerasi 
utilizzate in PCR replicano il DNA ad una velocità di circa 500-1000 bp min" (Ta- 
bella 4.2). Il tempo di incubazione del campione di PCR alla temperatura di esten- 
sione viene aggiustato in base alla lunghezza del prodotto atteso. 


Tabella 4.2. Le proprietà di tipi diversi di DNA polimerasi termostabili 


Taq DNA Tfl DNA Pfu DNA Tli DNA Tgo DNA 


polimerasi polimerasi polimerasi polimerasi polimerasi 
Organismo Thermus Thermus Pyrococcus Thermococcus Thermococcus 

aquaticus flavus furiosis litoralis gorgonarius 
PCR optima: 
Tempo di estensione/kb (min) J 1 2 2 si 
Temperatura di estensione (°C) 70-75 70-74 70-75 70-75 70-75 
[Magnesio] (mM) 1-4 1-4 2-4 2-4 2-4 
pH @ 25°C 7,0-7,5 7,0-7,5 8,0-9,0 7,0-7,5 7,0-7,5 
[ANTP] (mM) 40-200 40-200 40-200 40-200 200 
[Primers] (MM) 0,1-1,0 0,1-1,0 0,1-1,0 0,1-1,0 0,1-1,0 
Attività 5‘-3’ esonucleasica Sì Sì No No No 
Attività 3‘-5’ esonucleasica No No Sì Sì Sì 


Tasso di errore approssimativo 5.0x10* 5x10° 13x10) = 2.8x-10% 2.0x 1079 
(errori per base replicata) 
Estremità del prodotto di PCR 3°-A 3°-A Piatte Piatte Piatte 
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Il numero di cicli di PCR effettuati durante un singolo esperimento dipende 
dalla quantità di DNA stampo iniziale e dalla quantità di DNA necessario dopo il 
processo di amplificazione. In generale, per evitare errori di replicazione (vedi 
sotto), è meglio utilizzare il minor numero di cicli possibile. Questo generalmente 
consiste in 17-25 cicli. Quando i cicli sono stati completati, molti protocolli di 
PCR includono un passaggio finale di estensione (72 °C, 5 min) per garantirsi che 
tutto il DNA nella reazione sia stato replicato in una molecola a doppia elica. Que- 
sta estensione finale può anche aumentare l'efficienza di clonaggio dei prodotti di 
PCR (Li e Guy, 1996). 


4.2 DNA polimerasi termostabili 


Il batterio Thermus aquaticus fu inizialmente scoperto in diverse sorgenti calde nel 
Parco Nazionale di Yellowstone (Brock e Freeze, 1969). Da allora è stato trovato in 
habitat termali in tutto il mondo. L'organismo tollera temperature comprese tra 50 
e 80°C, e la crescita ottimale avviene attorno ai 70°C. La Taq DNA polimerasi, 
isolata da questo organismo, è un enzima monomerico con un peso molecolare di 
94 kDa (Chien, Edgar e Trela, 1976: Lawyer et al.. 1989). L'enzima stesso è ter- 
mostabile: replica il DNA a 74°C e rimane funzionale anche dopo incubazione a 
95°C. L'enzima possiede un'attività polimerasica 5°-3’ e un'attività esonucleasica 
5°-3’, ma manca di un'attivita esonucleasica 3°-5’ (correzione di bozze). La man- 
canza di un'attività di correzione di bozze significa che se una base sbagliata viene 
incorporata durante l’estensione di una catena polinucleotidica, questa non viene 
più rimossa. Quindi, la Taq DNA polimerasi introduce mutazioni nei prodotti di 
PCR amplificati e viene considerata “soggetta ad errore”. In saggi in vitro, la Taq 
DNA polimerasi incorpora una base sbagliata ogni 10*— 10° basi replicate (Barnes. 
1992; Cline, Braman e Hogerfe, 1996). L'ampia variazione nel tasso di errore sti- 
mato è dovuta, in parte, al metodo utilizzato per valutare l'introduzione di muta- 
zioni. Secondo la stima peggiore, con un tasso di errore di 1 x 10* errori per base 
replicata, se si amplifica in 25 cicli una sequenza di 1 kb con la Tag, il 10% circa 
dei prodotti amplificati conterranno mutazioni. Comunque, poiché mutazioni che 
avvengono in un ciclo vengono poi amplificate nei cicli successivi, la reale fre- 
quenza di mutazione varia da esperimento ad esperimento. Questo livello di errore. 
comunque, non influenza la riuscita dell'esperimento di PCR. Se la PCR viene ef- 
fettuata solo per valutare la presenza o l'assenza di un gene in una particolare mo- 
lecola di DNA, allora il successo della reazione non verrà influenzato dall’introdu- 
zione di errori nella sequenza amplificata. D'altra parte, se il gene amplificato deve 
essere sottoposto a studi funzionali, allora gli errori di PCR possono influenzare 
notevolmente l'esperimento. Il problema dell’introduzione di errori significa che i 
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prodotti di PCR andrebbero sequenziati prima di essere utilizzati in esperimenti di 
clonaggio. Inoltre, bisognerebbe scegliere diversi cloni di PCR indipendenti per ga- 
rantirsi che la sequenza ottenuta sia rappresentativa. 

Un altro aspetto funzionale della Taq DNA polimerasi, che influenza la se- 
quenza finale del prodotto di PCR, è la tendenza dell’enzima ad incorporare un 
deossinucleotide (frequentemente un’adenosina) all’estremità 3’ dell’elica di DNA 
neo-sintetizzata, in maniera indipendente dallo stampo. Una conseguenza di tale at- 
tività è che i prodotti di PCR ottenuti con la Taq non hanno estremità piatte, ma 
hanno un singolo residuo di A sporgente in 3°. Questa proprietà è stata sfruttata per 
aiutare il clonaggio dei prodotti di PCR (vedi sotto). 

Dopo la scoperta della Taq DNA polimerasi, sono state descritte ed utilizzate in 
esperimenti di PCR anche diverse altre DNA polimerasi termostabili. Mentre la 
Taq rimane l’enzima termostabile più comunemente utilizzato in esperimenti di 
PCR, DNA polimerasi di altri organismi hanno proprietà diverse che le rendono 
utili in alcune applicazioni (Tabella 4.2). 

Alcune altre DNA polimerasi termostabili, ad es. la Pfu polimerasi, isolata 
dall’organismo Pyrococcus furiosis, possiedono un'attività esonucleasica 3°-5’ 
di correzione di bozze, e quindi il loro tasso di mutazione è ridotto. Secondo 
l'esempio fatto sopra, se un segmento di DNA di 1 kb è amplificato in 25 cicli 
con la Pfu polimerasi, solo lo 0,1% dei prodotti conterrà mutazioni. Inoltre, al- 
cune altre DNA polimerasi termostabili producono molecole con estremità piatte 
(Tabella 4.2). 

L'attività esonucleasica 5-3’ della Taq DNA polimerasi implica che l’enzima 
sia capace di degradare i primer oligonucleotidici nella reazione della PCR. Questo 
è particolarmente rilevante durante il primo passaggio di denaturazione nel ciclo 1, 
quando gli oligonucleotidi non sono legati al DNA stampo e la polimerasi è libera 
in soluzione. Durante il primo ciclo di riscaldamento, la temperatura della miscela 
di PCR sale da temperatura ambiente (o da 4°C, se la reazione era stata assemblata 
in ghiaccio) a 94 °C. Ciò significa che, ad un certo punto, la temperatura all’interno 
della provetta sarà 72°C (temperatura ottimale per la Taq polimerasi), ma l’en- 
zima non sarà in grado di replicare il DNA perché gli oligonucleotidi non sono 
appaiati al DNA stampo. Il passaggio a questa temperatura senza che possa avve- 
nire replicazione, favorirà la degradazione dei primers, e quindi una reazione di 
PCR inefficiente. Per prevenire questo problema e la sintesi di prodotti di PCR 
non specifici prima dell’inizio dei cicli di reazione, la Taq polimerasi può essere 
aggiunta alla miscela di reazione quando questa è già a 94°C. Questa “partenza 
calda” aumenta sia la resa che la specificità della reazione di PCR. In alternativa, 
la Taq DNA polimerasi può essere mescolata con un anticorpo specifico che lega 
l'enzima e ne inibisce l’attività (Kellogg et a/., 1994). Il complesso enzima-anti- 
corpo impedisce la replicazione a bassa temperatura, mentre a temperatura elevata 
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il complesso si dissocia irreversibilmente, lasciando l’enzima libero di svolgere la 
su attività. 

L'esistenza di un numero elevato di DNA polimerasi termostabili con pro- 
prietà diverse ha portato a miscelarle per applicazioni specifiche. Ad esempio, la 
Taq DNA polimerasi fornisce alte rese di prodotto di PCR, ma introduce errori e 
la dimensione massima del prodotto di PCR ottenibile è di circa 5-7 kbp. La Pfu 
polimerasi, d’altro canto, è molto più precisa nella sintesi, ma ha difficoltà nel 
sintetizzare efficientemente frammenti amplificati di DNA più lunghi di 7 kbp. Un 
miscela delle due polimerasi (15 parti di Taq ed | parte di Pfu), è stata dimostrata 
amplificare fedelmente ed efficientemente frammenti di DNA fino a 35 kbp di 
lunghezza (Barnes, 1994). 


4.3 DNA stampo 


Qualunque campione di DNA può essere utilizzato come stampo in una reazione di 
PCR, inclusi DNA plasmidico lineare, circolare e superavvolto, DNA genomico, 
cDNA, etc. La fonte del DNA è irrilevante, poiché la PCR è puramente dipendente 
dalla sequenza. L’unica richiesta è che i siti di legame dei primer e la sequenza che 
li separa siano intatti. Anche campioni di DNA più vecchi di 7.000 anni sono stati 
usati con successo in esperimenti di PCR (Lawlor et al., 1991). 

Nei casi che abbiamo discusso finora, e per questioni di chiarezza, abbiamo 
considerato l'amplificazione di una singola molecola di DNA bersaglio. Mentre 
questa situazione è certamente ottenibile (Li et al., 1988), nella pratica comune 
si utilizzano grosse quantità di DNA. Quando si usano quantità ridotte di DNA, 
la contaminazione della reazione della PCR diventa un grosso problema. La 
grande capacità di amplificazione della PCR significa che anche la più piccola 
contaminazione di DNA può rovinare un esperimento. La contaminazione può 
derivare da una varietà di fonti, incluso il ricercatore che sta portando avanti l’e- 
sperimento, le provette e i puntali che vengono utilizzati per assemblare la rea- 
zione e anche gli enzimi ed i tamponi della reazione stessa. In un tipico esperi- 
mento di PCR si aggiungono 0.1-1.0 ug di DNA alla reazione, così che possa 
essere effettuato un numero di cicli relativamente moderato e ottenere comun- 
que materiale sufficiente per gli esperimenti successivi. Questo riduce il rischio 
che sequenze contaminanti interferiscano con l'amplificazione desiderata. A 
quante copie della sequenza bersaglio corrisponde questa quantità di DNA? Se 
aggiungiamo 1 ug di DNA genomico umano ad una reazione della PCR, questo è 
equivalente a 1 x 1079 / (6.4 x 10° x 650) = 2.4 x 107!° mol, poiché il DNA umano 
contiene circa 6.4 x 10° bp di DNA ed il peso molecolare medio di un paio di basi 
è 650 Da. Quindi 1 ug di DNA umano corrisponde a 2.4 x 107!° mol x 6 x 103 (il 
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numero di Avogadro) = circa 144.000 molecole. Quindi, un gene singolo sarà rap- 
presentato 288.000 volte in 1 ug di DNA genomico diploide. Un’amplificazione 
di otto milioni di volte di un segmento di 1.000 bp di questo DNA genomico, che 
dovrebbe essere raggiunta in 25 cicli di PCR, genererà circa 10 ug di questo fram- 
mento di DNA da 1.000 bp. Questa quantità è sufficiente perché una piccola fra- 
zione della reazione della PCR (tipicamente 10 ul su 50 ul di reazione totale) 
possa essere prontamente visualizzata con una colorazione con bromuro di etidio 
dopo elettroforesi in gel di agarosio. Questa quantità è anche più che sufficiente 
per la maggior parte delle procedure di clonaggio e per i protocolli di sequenzia- 
mento del DNA. 


4.4 Primer oligonucleotidici 


Il successo di una reazione della PCR è quasi totalmente dipendente dai primer oli- 
gonucleotidici. I primer devono essere disegnati così che uno riconosca l’elica 
senso del DNA da replicare (quindi è la stessa sequenza dell’elica antisenso), men- 
tre l’altro riconosca l'elica antisenso del DNA bersaglio (quindi è la stessa se- 
quenza dell’elica senso). Questo è mostrato in Figura 4.5. Tipicamente, i primer 
avranno le seguenti caratteristiche. 


e Saranno lunghi tra 17 e 30 nucleotidi, sufficienti per consentire un appaiamento 
specifico ad un'unica sequenza nell’intero genoma. 


e Avranno un contenuto in GC di circa il 50%. 


e La temperatura di appaiamento della coppia di primer, calcolata dall’equazione 
2(AT) + 4(GC), usata in un singolo esperimento dovrebbe essere approssimati- 
vamente uguale. 


e Sequenze con lunghe ripetizioni di un singolo nucleotide dovrebbero essere 
evitate per prevenire il legame del primer a sequenze ripetute nel DNA 
stampo. 


e I singoli primer non devono contenere sequenze complementari. Per esempio, un 
primer con sequenza 5°-GAGATCGATGCATCGATCTC-3' può apparire come 
una buona scelta per una reazione della PCR (lunghezza di 20 nucleotidi, conte- 
nuto in GC del 50%, privo di sequenze ripetute), ma è palidromico e, se l’estre- 
mità 5° si appaia all’estremità 3’, formerà una struttura a forcina. 
Questa struttura secondaria crea problemi e in pratica rimuove il primer dalla 
reazione della PCR e quindi l’amplificazione della sequenza bersaglio non av- 
verrà. 
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Primer 1 
5°-ATG AAG CTA CTG TCT TCT-3 
5’-...GAAAG ATG AAG CTA CTG TCT TCT ATC GAA CAA GCA TGC GAT ATT 


M K L L Ss Ss I E Q A (4 D E, 


AGG TCT CCG CTG ACT AGG GCA CAT CTG ACA GAA GTG GAA TCA AGG CTA 
R Ss P L T R A H L i E Vv E Ss R L 


GAA AGA CTG GAA CAG CTA TTT CTA CTG ATT TTT CCT CGA GAA GAC CTT 
E R L E Q L F L L I F P R E D L 


GAC ATG ATT TTG AAA ATG GAT TCT TTA CAG GAT ATA AAA GCA TTG TTA 
D M I L K M D Ss L Q D EP K A L L 


3'-CCT AAT AAA CAT GTT CTA-5' 


ACA GGA TTA TTT GTA CAA GAT AAT GTG AAT AAA GAT GCC...-3' 
E G L F dd Q D N Vv N K D Aoprss 
Primer 2 
Pi 
@ 
PSI 


lesa Prodotto della PCR 


Figura 4.5. La posizione dei primer per l'amplificazione di parte del gene GAL4 dal genoma di Sac- 
charomyces cerevisiae. (a) Sequenza del DNA, e corrispondente sequenza aminoacidica, di parte 
del gene GALA di lievito. La sequenza di DNA codificante i primi 100 aminoacidi della proteina Gal4p 
è mostrata in marrone. Sono indicate anche le posizioni dei primer per amplificare la sequenza. 
Notate che il primer 1 ha la stessa sequenza dell’elica senso, si appaierà quindi all’elica antisenso, e 
l’azione della DNA polimerasi produrrà una nuova elica senso. In maniera simile, il primer 2 ha la 
stessa sequenza dell'elica antisenso così che riconoscerà l'elica senso e porterà alla formazione di 
una nuova elica antisenso. (b) Risultato di un esperimento di PCR effettuato con ciascuno dei singoli 
primer o con la combinazione di entrambi. Il prodotto di PCR è stato visualizzato dopo colorazione di 
un gel di agarosio con bromuro di etidio. 


* Non dovrebbe esserci alcuna complementarietà tra i due primer o tra le estremità 3’ 
dei singoli primer. Per esempio, i seguenti primer sembrano essere una buona scel- 
ta: 5°-GATCGATCGATACGTGATCC-3° e 5-CGTAGCTAGCTAGGATCACG-3”. 
Però, le estremità 3’ dei due primer sono complementari tra loro e si possono 
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formare dimeri di primer, che verranno replicati durante i primi cicli della rea- 
zione di PCR: 


5°-GATCGATCGATACGTGATCC-3 
3°-GCACTAGGATCGATCGATGC-5” 


PCR 


5’-GATCGATCGATACGTGATCCTAGCTAGCTACG-3' 
3'°-CTAGCTAGCTATGCACTAGGATCGATCGATGC-3" 


La maggior parte dei primer che seguono i criteri definiti sopra possono essere fatti 
funzionare in esperimenti di PCR; sono stati sviluppati diversi pacchetti software 
liberamente disponibili, inclusi alcuni che sono basati sul web, per aiutare il pro- 
cesso di progettazione dei primer (Rozen e Skaletsky, 1998). 


4.4.1 Sintesi dei primer oligonucleotidici 


La maggior parte degli oligonucleotidi sono preparati su sintetizzatori di acidi nu- 
cleici commerciali, utilizzando la chimica dei fosforamiditi. La chimica dei fosfo- 
ramiditi per la sintesi degli oligonucleotidi fu introdotta circa 20 anni fa (McBride 
e Caruthers, 1983). I mattoni utilizzati per la sintesi sono i nucleosidi fosforamiditi 
(a volte chiamati monomeri). Questi sono modificati per prevenire la ramificazione 
e reazioni secondarie indesiderate durante la sintesi. Essi sono modificati all’estre- 
mità 5° (con un gruppo dimetossitritile) e all’estremità 3’ (con un gruppo 
3’-fosfito protetto da un B-cianoetile), e possono anche includere modificazioni ad- 
dizionali per proteggere le ammine primarie reattive nella struttura ad anello del 
nucleoside. 

L'approccio con i fosforamiditi per la sintesi degli oligonucleotidi procede in 
quattro passaggi che sono schematizzati in Figura 4.6. La sintesi automatica viene 
effettuata su supporti solidi, generalmente polistirene. Il polistirene è caricato in 
una piccola colonna che serve da camera di reazione. Una colonna di questo tipo 
viene attaccata a tubi che trasportano i reagenti in un sintetizzatore di DNA e le 
reazioni chimiche procedono sotto il controllo di un computer. Le basi sono ag- 
giunte alla catena in crescita in direzione 3’-5’ (l’opposto della sintesi enzimatica 
da parte delle DNA polimerasi). La sintesi inizia utilizzando il polistirene già deri- 
vatizzato con la prima base, che è attaccata mediante un legame estere al 3’ idros- 
sile [Fig. 4.6 (a)]. 

La sintesi del primer incomincia con l’eliminazione del gruppo 5’ tritil [Fig. 4.6 
(b)] con un breve trattamento acido. Il monomero attivato dal tetrazolo è legato al 
5’ ossidrile libero [Fig. 4.6 (c)] e il legame fosfito risultante è ossidato a fosfato da 
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Polistirene derivatizzato 
con fosforamidite T 
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n, 
N. 9 5 
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fessi Ea 
Nucleoside fosforamidite 


Figura 4.6. La produzione sintetica di primer oligonucleotidici. Produzione di 5°-AT-3". | nucleosidi fo- 
sforamiditi sono modificati con un gruppo di protezione dimetossitritil all'estremità 5’ (rosso) e un 
gruppo 3’ fosfito protetto da un B-cianoetil (blu). Inoltre, altri gruppi (verde) proteggono le ammine pri- 
marie presenti altrove nella molecola. Vedi il testo per i dettagli del ciclo di reazione. 


un trattamento con iodio [Fig. 4.6 (d)]. Questo completa un ciclo di sintesi dell’oli- 
gonucleotide. 

La reazione di condensazione del nucleoside è molto efficiente, con meno del 
1% dei gruppi 5’ ossidrilici che non reagiscono con il nucleoside. Per impedire a 
queste molecole che non hanno reagito di partecipare a reazioni successive, cau- 
sando delezioni non desiderate, i gruppi 5°--OH che non hanno reagito vengono 
bloccati da acetilazione (capping) con anidride acetica prima del passaggio di ossi- 
dazione. L'efficienza di legame garantisce che i primer di lunghezza fino a 60 nu- 
cleotidi possano essere prodotti di routine. 

Quando la sintesi è completa, l’oligonucleotide viene staccato dal supporto so- 
lido con idrossido di ammonio concentrato a temperatura ambiente. L’incubazione 
prolungata in ammonio a temperatura elevata libera il fosforo dalla protezione me- 
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diante la B-eliminazione del gruppo cianoetilico e rimuove anche i gruppi di prote- 
zione dalle basi eterocicliche. L’oligonucleotide finito può essere purificato dai 
prodotti chimici contaminanti mediante precipitazione, e l’oligonucleotide a se- 
quenza completa è generalmente isolato mediante la purificazione in HPLC. 

Un grande vantaggio della sintesi chimica del primer è che qualsiasi sequenza 
può essere prodotta rapidamente e a costi relativamente bassi (< $ 0.5 per base). La 
sequenza di un primer può anche essere mista. Ad esempio, con il primer schema- 
tizzato in Figura 4.6, se allo stadio c della reazione viene aggiunta una miscela 1:1 
di monomeri dT e dC, il primer risultante potrà avere o una sequenza 5°-TA-3’ 0 
5°-CA-3”. Il prodotto finale sarebbe una miscela uguale delle due specie. Control- 
lando la quantità di ciascun monomero aggiunto al passaggio di condensazione, si 
possono ottenere miscele con quantità definite di primer modificati in qualunque 
posizione tranne che all'estremità 3°. Inoltre, alla sequenza del primer possono es- 
sere aggiunte basi modificate (es. basi contenenti fosfotioati o marcate con biotina). 


4.5 Primer non totalmente compiementari (mismatch) 


Non è necessario che i primer oligonucleotidici utilizzati in un esperimento di PCR 
siano totalmente complementari alla sequenza bersaglio. Questo è particolarmente ri- 
levante quando si vogliono creare mutazioni, o alterazioni volontarie, nella sequenza 
di DNA amplificata o quando si sta tentando di trovare sequenze geniche omologhe 
ad una sequenza già nota. Vedremo qui alcuni degli utilizzi più semplici della muta- 
genesi basata sulla PCR, mentre le strategie di mutagenesi più eleganti saranno di- 
scusse nel Capitolo 7. Nella sequenza del primer l’unica posizione che deve essere 
esattamente complementare alla sequenza bersaglio è l’estremità 3”. Se l'estremità 3° 
del primer non è complementare alla sequenza bersaglio, la polimerasi non riuscirà 
ad estendere efficientemente il primer e la PCR sarà inefficiente, o fallirà completa- 
mente. Questa proprietà viene sfruttata per la diagnosi di mutazioni puntiformi all’in- 
terno di geni (vedi sotto). Per pensare a come la PCR possa essere impiegata per in- 
trodurre mutazioni nei prodotti di amplificazione, dobbiamo pensare ai primer stessi. 
I primer iniziano il processo di replicazione, ma vengono essi stessi incorporati nel 
prodotto finale di amplificazione. Di conseguenza, qualsiasi cambiamento di base tra 
il primer ed il DNA stampo verrà trasferito al prodotto di amplificazione. Poiché non 
possiamo inserire mutazioni all'estremità 3’ del primer, una posizione favorita per in- 
trodurre cambiamenti è l'estremità 5’ del primer (Fig. 4.7). 

In questo caso, stiamo amplificando la stessa sequenza mostrata in Figura 4.5. 
Questa volta, però, i primer oligonucleotidici contengono sequenze aggiuntive alle 
loro estremità 5°. Nel caso del primer 1, esso contiene la sequenza di riconosci- 
mento dell’enzima di restrizione EcoRI all'estremità 5’ della sequenza utilizzata 
per riconoscere il gene GALA. Questo primer ed il primer mostrato in Figura 4.5 si 
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Primer 1 
5’-GAATTCATGAAGCTACTGTCTTCT-3' 
5’-...TGAAAGATGAAGCTACTGTCTTCT e] GGATTATTTGTACAAGATAATGTG. .. -3' 
3'-...ACTTTCTACTICGATGACAGAAGA gene GAL4] CCTAATAAACATGTICTATTACAC. .. 1-5? 
3'-CCTAATAAACATETTCTACOTACO-5 
Primer 2 
PCR 
EcoRI BamHi 
\TTCATGAAGCTACTGTCTTCT _———GGATTATTTGTACAAGATEGAT0-3/ 
rarcTAcTTeGaTeacagaaga l9L0S.SALA cOrAATAAACATETTOTA TA CC-5 


Figura 4.7. Primer per l’amplificazione di parte della sequenza del gene GAL4 dal genoma di 
Saccharomyces cerevisiae, modificati in modo da includere siti di riconoscimento per enzimi di restri- 
zione. Il prodotto finale della PCR contiene le sequenza presenti nei primer. 


legheranno alla stessa sequenza di DNA stampo, con la stessa affinità. La sequenza 
di riconoscimento di EcoRI non è totalmente complementare alla sequenza stampo, 
ma gli appaiamenti sbagliati non sono sufficienti per prevenire il legame specifico 
del primer. Invece, la sequenza di riconoscimento di EcoRI verrà incorporata nel 
prodotto finale di PCR, come mostrato in Figura 4.7. Il primer 2 in questa figura 
contiene il sito di riconoscimento per l’enzima di restrizione BamHI, che verrà an- 
ch’esso incorporato nel prodotto finale. Il clonaggio di tale prodotto finale diventa 
ora semplice, tagliando con i due enzimi di restrizione, dopo essersi assicurati che 
non ci siano siti EcoRI e BamHI nel prodotto di PCR stesso! Spesso, per tagliare 
efficientemente, gli enzimi di restrizione necessitano di una sequenza di DNA più 
lunga del solo sito di riconoscimento. Quindi, in genere, a monte del sito di ricono- 
scimento dell’enzima di restrizione, si aggiungono da tre a sei basi in più all’estre- 
mità 5’ del primer. Queste sono spesso G o C (chiamato un “GC clamp”) per otte- 
nere il livello massimo di appaiamento tra le due eliche e rendere più efficiente il 
taglio da parte degli enzimi di restrizione. 

Qualunque differenza di sequenza tra il primer ed il DNA stampo verrà trasfe- 
rita nel prodotto finale di PCR. Quindi, è possibile introdurre mutazioni volontarie 
nel prodotto amplificato alterando la sequenza del primer. Questo è particolar- 
mente importante se si vuole cambiare la sequenza codificante di un gene, per 
cambiare la sequenza aminoacidica di una proteina, o se si vuole modificare l’uti- 
lizzo dei codoni in un gene, ad esempio per introdurre un sito di riconoscimento 
per un enzima di restrizione senza alterare la sequenza aminoacidica della proteina 
risultante, o per far sì che vengano utilizzati i codoni favoriti, se si vuole che la 
proteina codificata venga prodotta a livelli elevati. 

Il secondo grande utilizzo dei primer non totalmente complementari è nella ri- 
cerca di geni che codifichino per una determinata proteina, e nella ricerca di geni 
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omologhi. In biochimica l'isolamento e la caratterizzazione di una proteina è pra- 
tica comune. Per esempio, è possibile isolare una proteina e sequenziarne l’estre- 
mità amino-terminale identificando i seguenti aminoacidi: Met-Ile-Trp-Pro-Phe. La 
degenerazione del codice genetico comporta che tale sequenza aminoacidica possa 
essere codificata dalle seguenti sequenze di DNA: 


Met - Ile - Trp - Pro - Phe 
5°- ATG- ATA-TGG-CCA-TTC-3' 


C er i 
T IL 
G 


Avendo in mano solo la sequenza della proteina, è impossibile prevedere quale co- 
done sarà utilizzato in un gene particolare per codificare uno specifico aminoacido. 
Per amplificare mediante PCR il gene codificante questa sequenza proteica, dob- 
biamo, quindi, disegnare un primer degenerato. Il primer deve potersi appaiare a 
tutte le combinazioni possibili che possono codificare la sequenza proteica. Per ot- 
tenere ciò si può sintetizzare il primer indicato qui sotto: 


5--ATG-ATA-TGG-CCN-TTC-3 
Cc E 
T 


dove N è una miscela equimolare di A, T, C e G. Il primer indicato sopra verrebbe 
prodotto come una miscela di 24 primer differenti. Solo una di queste 24 combina- 
zioni sarà totalmente complementare alla sequenza codificante la proteina, ma le 
altre differiranno dalla sequenza bersaglio solo per un singolo nucleotide e potreb- 
bero comunque promuovere una PCR efficiente. Nel caso mostrato qui, perché la 
PCR proceda è necessario un primer addizionale che riconosca sequenze in 3’ a 
quelle mostrate. 

Un’alternativa alla miscela di tutti e quattro i nucleotidi in un’unica posizione 
del primer è l’utilizzo dell’inosina. L’inosina è una purina, che si trova natural- 
mente nei tRNA e che può appaiarsi con C, T e A. L’appaiamento inosina-A non 
può rientrare correttamente nella struttura del DNA a doppia elica, essendo un ap- 
paiamento purina-purina; quindi ci sarà uno svantaggio energetico quando l’elica si 
deforma in corrispondenza di questo appaiamento. L’inosina può essere utilizzata 
nei primer nelle posizioni dove sono previste tutte e quattro le basi. Ciascuna inser- 
zione di un’inosina riduce di quattro volte la degenerazione del primer. Possono 
verificarsi appaiamenti scorretti inosina-G, ma appaiamenti precisi in altre posi- 
zioni del primer possono superare questo problema. L'utilizzo di inosina nel primer 
richiede che la DNA polimerasi utilizzata nell’esperimento di PCR sia capace di 
sintetizzare DNA usando uno stampo contenente inosina. La Taq polimerasi è ca- 
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(a) | REGIONE POU SPECIFICA 
Pit-l: KSKLVEEPIDMDSPEIRELEKFANEFKVRRIKLGYTOTNVGEALAAVHG- --SEFSQTTICRFENLOLSFKNACKLKAILSKWLEEAEQV 


Oct-l:; ELEQFAKTFKORRIKLGFTOGDVGLAMGKLYG - - - NDFSOTTISRFEALNLSFKNMCKLKPLLEKWLNDAENL 
Oct-2: PPSHPEEPSDLE - - - - -ELEQFARTFKORRIKLGFTOGDVGLAMGKLYG - - - NDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAETM 
unc-86: RYPIAPPTSDMDT- -DPRQLETFAEHFKQRRIKLGVTQADVGKALAHLKMPGVGSLSQSTICRFESLTLSHNNMVALKPILHSWLEKAEE- 
CONSENSO? . Lee Di, ere LE.FA...FK.RRIKLG.TO. VGA... ce inn SQ.TI.RFE.L.LS..N...LK..L..WL..AE.. 
n 
Sequenza 1 


Pit-l: 
Oct.1: 
Oct-2: 
unc-86: 
Consenso: 


=== 
Sequenza 2 


(b) Sequenza 1 Sequenza 2 
..PheLysValArgArgIleLysLeuGly......... ArgValTrpPheCysArgGlnArgGln.. 
Gln Arg 
5’- CONAAAGTNCGNCGNATAAAACTNGGN-3° 5/- CENGTNTGGTTCTEGCCEGNCGNCGNCAA - 3’ 
GCA A _A c GT A T TA AA A G 
T 


(c) 
Primer 1 (26 mer): 5’-CCNAA(AG) (GC) (TA)N(CA)GN(CA)GNAT(ACT)AA(AG) (CT) TNGG-3° 
Primer 2 (26 mer): 5°- (TC) TENC(GT)N(CT) (GT)NC(GT) (GA) CA (GA) AACCANACNC-3° 


Figura 4.8. Utilizzo di primer degenerati per l’identificazione di nuovi geni POU. (a) Allineamento 
delle sequenze delle proteine Pit-1, Oct-1, Oct-2 e unc-86. Le sequenza presenti n almeno due delle 
proteine sono colorate, mentre le sequenza presenti in tutte e quattro le proteine sono scritte sotto, 
come consenso. (b) Le sequenze di nove residui aminoacidici più conservate all’interno della regione 
POU specifica e dell’omeodominio POU, e le sequenze di DNA che possono codificarle. (c) La se- 
quenza dei primer utilizzati per identificare ulteriori proteine contenti il dominio POU. 


pace di farlo, ma altre polimerasi (es. Vent e Pfu) non ne sono capaci (Knittel e Pi- 
card, 1993). 

Diversi geni esistono in famiglie con sequenze aminoacidiche simili (e di con- 
seguenza con sequenza geniche simili), che codificano per una funzione analoga in 
proteine differenti. La PCR può essere utilizzata per identificare membri ulteriori 
della famiglia, dopo che alcuni di questi siano stati già caratterizzati. Le proteine 
che contengono il dominio POU, sono una famiglia di fattori trascrizionali che 
condividono un dominio di legame al DNA molto conservato [Fig. 4.8(a)]. La fa- 
miglia deve il proprio nome ai primi quattro membri che furono caratterizzati, tre 
proteine di mammifero Pit-1, Oct-1 e Oct-2, ed il gene unc-86 del nematode 
Caenorhabditis elegans (Herr et al., 1988). Nel dominio POU ci sono due regioni 
estremamente conservate, chiamate il dominio POU specifico e l’omeodominio 
POU. L'ultimo mostra un elevato livello di omologia con le proteine che conten- 
gono un omeodominio e che controllano lo sviluppo di Drosophila. Mutazioni in 
questi geni hanno effetti drammatici sullo sviluppo dell’organismo. Per esempio, 
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mutazioni nel gene Pit-1 di topo causano il mancato sviluppo della ghiandola pitui- 
taria e la generazione di topi nani (Li er al., 1990). 

Per identificare altri membri della famiglia POU, sono stati disegnati primer in 
base alle zone più conservate della regione POU specifica dell’omeodominio POU 
[Fig. 4.8(b)]. Questi primer sono altamente degenerati, in base alla degenerazione 
del codice genetico, ma sono stati utilizzati con successo per identificare ulteriori 
proteine POU da diverse fonti (Lillyerop et al., 1992). I due primer mostrati qui 
[Fig. 4.8(c)] amplificano un frammento di DNA di circa 400 bp che è abbastanza 
eterogeneo. L’eterogeneità è dovuta a differenze nella lunghezza dei singoli geni 
che codificano per proteine con un dominio POU e che sono amplificati dai cam- 
pioni di DNA. Questo approccio ha portato all’identificazione di molti nuovi geni, 
inclusi membri della famiglia di Brn-3, che sono molto espressi in cellule neuro- 
nali e giocano un ruolo nel differenziamento e nella sopravvivenza dei neuroni sen- 
soriali e motori (Erkman et al., 1996). 


4.6 La PCR nella diagnosi delle malattie genetiche 


La possibilità della PCR di amplificare sequenze di DNA specifiche ne ha fatto 
uno strumento utile per la diagnosi di difetti e mutazioni genetiche. Poiché la PCR 
richiede una conoscenza precedente della sequenza di DNA che deve essere ampli- 
ficata, bisogna conoscere il sito della mutazione prima che possa essere provata 
l’analisi per PCR. Il grande vantaggio dei metodi basati sulla PCR è la piccola 
quantità di DNA necessaria per effettuare una diagnosi. Campioni di sangue, o cel- 
lule dell'interno della guancia forniscono materiale sufficiente per fare una dia- 
gnosi nell'adulto, mentre piccolo campioni di villi coriali possono essere utilizzati 
per fare una diagnosi in utero. 

La PCR è utilizzata per riconoscere sia mutazioni per inserzione/delezione, che 
mutazioni puntiformi. È stato sviluppato un ampio spettro di tecniche per il ricono- 
scimento di mutazioni mediante PCR. Qui ci concentreremo su un paio di esempi, 
ma il lettore deve essere a conoscenza che esistono anche diverse alternative. 


e Mutazioni per inserzione/delezione. La sindrome di Waardenburg, una malattia 
ereditaria autosomica dominante, è caratterizzata da una combinazione di sordità 
e pigmentazione anormale. La malattia è responsabile di più del 2% dei casi di 
sordità negli adulti, ed è spesso associata con una ciocca bianca frontale di ca- 
pelli e ciglia bianche. Alcuni tipi di sindrome di Waardenburg sono causati da 
mutazioni nel gene PAX-3, un fattore trascrizionale implicato nella regolazione 
dello sviluppo embrionale. Una delle prime mutazioni trovate nel gene PAX-3 
da un paziente con sindrome di Waardenburg è stata una delezione di 18 bp 
nel DNA codificante per dominio di legame al DNA del fattore trascrizionale 
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(Tassabehji et al., 1992). La delezione può essere rilevata mediante PCR in altri 
pazienti con sindrome di Waardenburg. I primer possono essere disegnati sui lati 
del sito di delezione (Fig. 4.9). L’amplificazione della sequenza selvatica pro- 
duce un frammento lungo di DNA (156 bp nella Fig. 4.9), mentre l’amplifica- 
zione della sequenza mutante produce un frammento di DNA più piccolo (138 
bp nella Fig. 4.9). Bande di queste dimensioni possono essere facilmente sepa- 
rate in gel di poliacrilamide o di agarosio. Quindi, la presenza della mutazione 
può essere determinata dalla dimensione del prodotto di PCR ottenuto. In questo 
caso, poiché la malattia è dominante, la maggior parte dei pazienti sono eterozi- 
goti, con una copia del gene selvatico ed una copia del gene mutante. L’amplifi- 
cazione per PCR di un eterozigote produce due frammenti di DNA diversi (156 
bp e 138 bp nella Fig. 4.9). 


(a) Primer 1 
5'-CAG GGC CGC GTC AAC CAG CTC GGC-3' 
5'-G6GC CAG GGEC CEC GTC AAC CAG CTC GGC GGC GTT TTT ATC AAC GGC AGG CCG CTG 


G Q G R Vv N Q L G G Vv F IL N G R B L 


CCC AAC CAC ATC CGC CAC AAG ATC GTG GAG ATG GCC CAC CAC GGC ATC CGG CCC TGC 


P N H i R H K T V E M A H H G I R È C 


GTC ATC TCG CGC CAG CTG CGEC UTEG TCC TAC GGC TEC GTC TCC AAG ATC CIG-3' 
Vv L Sì R Q L R Vv S H G TC Vv Ss K L L 
3'-AGG GTG CCG ACG CAG AGG TTC TAG-5' 


Primer 2 


(b) Selvatico Mutante 


Figura 4.9. La PCR per individuare una mutazione per delezione patologica. (a) Sequenza di DNA 
selvatica dell'elica senso di parte dell'esone 2 del gene umano Pax-3. La sequenza mostrata rappre- 
senta la prima parte di un elemento altamente conservato che funzione come fattore trascrizionale, 
chiamato “paired box”. Alcuni pazienti malati di sindrome di Waardenburg contengono una delezione 
della sequenza mostrata in grassetto. Questo risulta nella delezione di sette aminoacidi (MAHHGIR) 
e nella formazione di un nuovo codone (AGG, che codifica arginina). Il risultato netto è la delezione 
di sei aminoacidi (MAHHGI) dalla proteina. | primer vengono disegnati ai lati del sito di delezione. 
(b) L’'amplificazione per PCR da un individuo normale con i primer 1 e 2 produce un frammento di 
DNA di 156 bp. L’amplificazione del DNA da un individuo malato di sindrome di Waardenburg con 
questa mutazione produce due frammenti di DNA — la banda da 156 bp ed una banda più corta da 
138 bp. La banda più corta deriva dal cromosoma che contiene la delezione di 18 bp. Poiché la sin- 
drome di Waardenburg è dominante, la maggior parte dei pazienti sono eterozigoti. 
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e Mutazioni puntiformi. Il metodo descritto sopra non può essere utilizzato per 
individuare mutazioni puntiformi (sostituzioni di base) in un gene. I primer 
fiancheggianti produrrebbero semplicemente un frammento delle stesse dimen- 
sioni sia per l'individuo mutante che per quello selvatico i prodotti di PCR po- 
trebbero essere sequenziati (Capitolo 8), ma questo richiede tempo. È necessa- 
rio un sistema basato sulla PCR che identifichi mutazioni di una singola base. 
La PCR allele specifica, sfrutta la proprietà per la quale un primer deve essere 
correttamente appaiato all’estremità 3’ perché possa essere esteso efficiente- 
mente dalla DNA polimerasi (Newton er a/., 1989; Wu et al., 1989). L’amplifi- 
cazione per PCR allele specifica di una mutazione del gene per la B-globina, 
che causa l’anemia falciforme, è schematizzata in Figura 4.10. Per rilevare mu- 
tazioni puntiformi in un gene, è necessario disegnare tre primer che devono par- 
tecipare a due reazioni di PCR. Un primer (il primer 3 in Fig. 4.10) è comune ad 
entrambe le reazioni, mentre gli altri primer (primer 1 e 2) rilevano la presenza 
della sequenza di DNA selvatica o mutante. L’amplificazione della sequenza sel- 
vatica con i primer 1 e 3 funziona. Invece, se vengono utilizzati i primer 2 e 3, la 
reazione non funziona a causa della non complementarietà tra la sequenza selva- 
tica e l'estremità 3’ del primer 2. In modo simile, l'amplificazione della se- 
quenza di DNA mutante con i primer 1 e 3 non è produttiva, mentre la PCR fun- 
ziona normalmente con i primer 2 e 3 quando si usa la sequenza mutante come 
stampo. I risultati di tale analisi sono mostrati in Figura 4.10 (b). Qui, vengono 
paragonati una sequenza di DNA selvatica con quella di un individuo omozigote 
per la mutazione. Se un individuo fosse eterozigote, entrambe le reazioni di PCR 
funzionerebbero normalmente poiché il DNA stampo conterrebbe entrambi gli al- 
leli. Per garantirsi che tutte le reazioni di PCR funzionino correttamente, normal- 
mente si include una coppia di primer di controllo, che amplifica una regione di 
un gene non correlato, così che una banda, la PCR di controllo, sia comunque 
sempre presente, e si valuta la presenza o l'assenza di una banda addizionale. 


4.7 Clonaggio dei prodotti di PCR 


Come abbiamo già visto, è possibile clonare i prodotti di PCR mediante l’inser- 
zione di sequenza aggiuntive alle estremità 5’ dei primer, così che siano incorporati 
siti di riconoscimento per enzimi di restrizione. È anche possibile clonare prodotti 
di PCR direttamente, traendo vantaggio dall’attività terminal-trasferasica della Taq 
DNA polimerasi, che aggiunge un residuo A in maniera indipendente dallo stampo 
all'estremità 3’ dei prodotti di PCR. Una conseguenza di tale attività è che la mag- 
gior parte delle molecole amplificate utilizzando la Taq polimerasi possiede una 
singola A sporgente in 3’. Queste possono essere legate, in un processo chiamato “TA 
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(a) Gene umano per la }-globina 


Esone 1 Esone 2 Esone 3 


# Primer 1 tà 
nerd x 
a 5'-CAC CTG ACT CCT GA-3' $ 
7 5/-CAC CTG ACT CCT GT-3' x 
5’-acc ATG GTG CAC CTG ACT CCT G3G GAG AAG TCT GCC GTT ACT GCC CTG 
(M) Vv H L T P E E K S A Vv TE A 


Esone 1 
TGG GGC AAG GTG AAC GTG GAT GAA GTT GGT GGT GAG GCC CTG GGC 
w G K Vv N Vv D E Vv G G E A L G 


ttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcatgtgg 


agacagagaagactcttgggtttetgataggcactgactetetetgectattggtetat 
3’-GACGGATAACCAGATA-5' 


ttteccacccettagi G cre cTE eTG...-3° Primer 3 
L L Vv 
Esone 2 
(b) Selvatico Mutante 
Primers: 1&3 283 1&3 283 


PCR di controllo 
Test PCR 


Figura 4.10. La PCR per rilevare mutazioni puntiformi. (a) L'’anemia falciforme può essere causata 
da una mutazione di un singolo paio di basi, una trasversione da A a T che converte Glu a Val in po- 
sizione 6 nel gene della B-globina umana. In individui omozigoti per la mutazione, la sostituzione 
nella subunità B-globina dell'emoglobina causa la ridotta solubilità della deossiemoglobina ed eritro- 


citi che assumono una forma irregolare. (b) Identificazione di una singola sostituzione di base nel 
DNA utilizzando la PCR allele specifica. 


cloning”, ad un ‘vettore T° linearizzato, il quale possiede singole T sporgenti ad en- 
trambe le estremità 3°, permettendo il clonaggio diretto e ad alta efficienza dei prodotti 
di PCR (Zhou, Clark e Gomez-Sanchez, 1995: Marchuk et al., 1991). La complemen- 
tarietà tra le A sporgenti al 3° del prodotto di PCR e le T sporgenti al 3’ del vettore fa- 
vorisce una ligazione efficiente, che non avviene con molecole di DNA ad estremità 
piatte. La strategia del TA cloning è schematizzata in Figura 4.11. 
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Sito di clonaggio 
multiplo 


Plasmide 


Tagliare con RI 
es. EcoRV 


polimerasi +dTTP 


es DNA 


| DNA ligasi 


Prodotto 


di PCR clonato 
nel plasmide 


Figura 4.11. TA cloning di prodotti di PCR. Un vettore plasmidico è tagliato con un enzima di restri- 
zione che causa la formazione di estremità piatte, es. EcoRV. Il vettore tagliato è poi trattato con la 
Taq DNA polimerasi in presenza di deossitimina trifosfato (ATTP). L'attività terminal-trasferasica della 
polimerasi catalizza l'aggiunta di un singolo residuo di dT all'estremità 3’ ossidrilica del DNA. Il vet- 
tore T così ottenuto è mescolato con un prodotto di PCR generato con la Taq ed le due molecole 
sono legate utilizzando la DNA ligasi. Il risultato è il frammento di PCR clonato nel vettore T. 


4.8 RT-PCR 


Come abbiamo discusso sopra, la PCR implica l'amplificazione di DNA a doppia 
elica. Non è però necessario che il DNA sia il materiale di partenza della PCR. La 
trascrizione inversa-PCR (RT-PCR) è stata sviluppata come un metodo per amplifi- 
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Figura 4.12. RT-PCR. L'enzima trascrittasi inversa utilizza un oligonucleotide complementare per ini- 
ziare la sintesi di DNA da una molecola di RNA. La singola elica di DNA prodotta è poi utilizzata 
come stampo per la sintesi di una seconda elica di DNA, e poi per l'amplificazione con PCR. 


care RNA e quantificarlo dopo la sua conversione a DNA. L’RT-PCR può essere 
utilizzata per il clonaggio, la costruzione di librerie di cDNA e la sintesi di sonde. 
La tecnica consiste di due parti (Fig. 4.12), la sintesi di DNA da RNA mediante 
trascrizione inversa (RT) e la seguente amplificazione di una molecola di DNA 
specifica mediante PCR. La reazione RT utilizza uno stampo a RNA (tipicamente 
RNA totale o RNA polyA*), un primer (casuale oppure primer oligo dT), ANTPS, 
tampone ed una trascrittasi inversa (che discuteremo nel capitolo 5) per generare 
una molecola di DNA a singolo filamento complementare all’RNA (cDNA). Il 
cDNA poi serve da stampo nella reazione di PCR. Durante il primo ciclo di PCR il 


o————__ 
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DNA a singolo filamento è reso a doppia elica grazie al legame di un altro primer 
complementare e all’azione della Taq DNA polimerasi. 

Come gli altri metodi per l’analisi del mRNA, quali Northern blot e saggi di 
protezione da nucleasi, la RT-PCR può essere utilizzata per quantificare il livello 
di mRNA contenuto nel campione originale. Questo tipo di analisi è particolar- 
mente importante per valutare variazioni dell'espressione genica. D'altra parte, 
poiché l’amplificazione per PCR è esponenziale, vengono amplificate anche pic- 
cole differenze di concentrazione fra i campioni e variazioni nel caricamento. 
Dopo 25 o 30 cicli di PCR anche differenze notevoli (100 volte o più) nella con- 
centrazione della sequenza bersaglio producono bande della stessa intensità. 
Quindi, la RT-PCR, quando utilizzata per analisi quantitativa del mRNA, richiede 
una attenta ottimizzazione. La quantificazione normalmente può essere relativa 0 
assoluta. 


e La quantificazione relativa paragona l’abbondanza del trascritto tra campioni 
multipli, usando un controllo interno co-amplificato per la normalizzazione del 
campione. I risultati sono espressi come rapporto tra il segnale specifico del 
gene e il segnale del controllo interno. Questo fornisce un valore relativo cor- 
retto per il prodotto specifico del gene in ciascun campione. Questi valori pos- 
sono essere paragonati tra campioni diversi per ottenere una stima dell’espres- 
sione relativa dell'RNA bersaglio nei campioni. 


e La quantificazione assoluta, utilizzando RT-PCR competitiva, misura la quantità 
assoluta (es. 5.3 x 10° copie) di una specifica sequenza di mRNA in un campione. 
Al campione vengono aggiunte diluizioni di un RNA sintetico (contenente siti di 
legame dei primer identici, ma leggermente più corto dell'RNA bersaglio) che 
viene co-amplificato con il bersaglio. Il prodotto di PCR dal trascritto endogeno 
viene poi paragonato alla curva di concentrazione creata dall’RNA competitore 
sintetico. 


4.9 Real-time PCR 


La real-time RT-PCR quantitativa combina le qualità migliori della RT-PCR rela- 
tiva e di quella competitiva, essendo accurata, precisa, applicabile ad un elevato 
numero di campioni e relativamente facile da eseguire. La real-time PCR automa- 
tizza il processo altrimenti laborioso della RT-PCR relativa, quantificando i pro- 
dotti di reazione per ciascun campione in ogni ciclo. I sistemi di real-time PCR si 
basano sulla rilevazione e la quantificazione di un reporter fluorescente, il cui se- 
gnale aumenta in maniera direttamente proporzionale alla quantità del prodotto di 
PCR nella reazione. Nella forma più semplice, il reporter è il colorante SYBR® 
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Figura 4.13. Quantificazione con TaqMan® real-time PCR. Durante il processo di PCR vengono uti- 
lizzati tre primer, due di questi (primer 1 e 2) stabiliscono l’inizio della replicazione su ciascuna delle 
due eliche di DNA, e il terzo (la sonda) si lega ad un’elica nel mezzo. La sonda contiene due basi 
modificate, un reporter fluorescente (R) all'estremità 5’ e un repressore della fluorescenza (Q) 
all'estremità 3’. Quando la replicazione avanza, il prodotto esteso dal primer 1 scalza l’estremità 5’ 
della sonda e l’attività esonucleolitica della polimerasi taglia il reporter fluorescente dalla sonda. La 


separazione del reporter dal repressore ne permette la fluorescenza. La quantità di fluorescenza è 
proporzionale alla quantità di prodotto di PCR fatto ed è misurata durante ciascun ciclo di PCR. 


Green specifico per il DNA a doppia elica (Wittwer et a/., 1997). Il SYBR Green 
lega il DNA a doppia elica, probabilmente nel solco minore e, una volta eccitato, 
emette luce. Quindi, se il colorante viene incluso in una reazione di PCR, quando il 
prodotto di PCR si accumula la fluorescenza aumenta. I vantaggi del SYBR Green 
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sono che è economico, facile da usare, e sensibile. Lo svantaggio è che il SYBR 
Green si lega a qualsiasi DNA a doppia elica nella reazione, inclusi dimeri di pri- 
mer e altri prodotti non specifici di reazione, e questo può risultare nella sovra- 
stima della concentrazione del bersaglio. Per reazioni con prodotti di PCR singoli e 
con primer ben disegnati, il SYBR Green può funzionare molto bene, con segnali 
spuri di fondo non specifici rilevabili solo negli ultimi cicli. 

Il metodo alternativo per quantificare i prodotti di PCR è il TaqMan®, che si 
basa, per la quantificazione, sul trasferimento dell’energia di risonanza della fluo- 
rescenza (FRET) delle sonde di ibridazione (Fig. 4.13). Le sonde TaqMan sono oli- 
gonucleotidi che contengono un colorante fluorescente come reporter, tipicamente 
attaccato alla base in 5’, e un colorante repressore, tipicamente attaccato alla base 
in 3°. La sonda è progettata per ibridarsi ad una regione interna del prodotto di 
PCR. Quando è irraggiato, il colorante reporter eccitato, invece di emettere fluore- 
scenza, trasferisce l’energia alla molecola di colorante repressore vicina, risultando 
in un substrato non fluorescente. Durante la PCR, quando la polimerasi replica uno 
stampo al quale è legata la sonda, l’attività 5-3’ esonucleasica della polimerasi ta- 
glia la sonda (Holland et al., 1991). Questo separa il colorante fluorescente dal re- 
pressore e non si osserva più FRET. La fluorescenza aumenta in ogni ciclo di PCR 
in modo proporzionale al taglio della sonda, ed è misurata in un termociclatore 
modificato. La real-time PCR è un potente strumento di quantificazione, ma il co- 
sto dei reagenti e della strumentazione è molto più alto di quello di normali rea- 
zioni di PCR. 


4.10 Applicazioni della PCR 


La PCR ha rivoluzionato la biologia molecolare permettendo l'amplificazione e la 
caratterizzazione di piccolissime quantità di acidi nucleici. Oltre che essere utile 
agli scienziati di base, questa tecnica ha un'importanza immensa in medicina per 
l’identificazioni di mutazioni in piccole quantità di DNA umano, e per i patologi, 
che normalmente devono identificare e caratterizzare piccole quantità di microrga- 
nismi infettivi. Una descrizione dettagliati dei numerosi e vari utilizzi per i quali è 
stata applicata la PCR va oltre lo scopo di questo testo, ma alcune delle applica- 
zioni più comuni della PCR sono elencate qui sotto: 


e clonaggio molecolare 

e sequenziamento di DNA 
e archeologia 

* applicazioni forensi 


* amplificazione di sequenze sconosciute 
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* patologia clinica 

* diagnosi genetica 

* caratterizzazione di mutazioni sconosciute 

* analisi di popolazioni/fingerprinting 

* analisi genomica 

* PCR quantitativa di RNA o DNA. 

Toccheremo alcuni di questi argomenti in capitoli successivi ma lettori interessati 


possono rivolgersi a letteratura più specifica (McPherson e Mgoiller, 2000; Innis, 
Gelfand e Sninsky, 1999). 


b Clonare un gene 


Concetti chiave 
+ Le librerie di DNA sono insiemi di molecole di DNA ricombinante 


+ Le librerie genomiche contengono frammenti di tutte le sequenze di 
DNA presenti nel genoma 


+ Le librerie di cDONA contengono copie a DNA dell'nRNA e sono 
specifiche per il tessuto e lo stadio di sviluppo. La loro produzione di- 
pende da un enzima DNA polimerasi RNA-dipendente, la trascrittasi 
inversa 


+ Le librerie basate sulla PCR non richiedono frammenti di DNA 
clonato e possono essere sottoposte a sottrazione per isolare geni 
espressi in maniera differenziale 


I genomi contengono quantità enormi di DNA (Tabella 5.1). Di conseguenza, 
ciascun gene contenuto in un genoma rappresenta solo una piccola frazione della 
dimensione del genoma stesso. Tutte le strategie tradizionali di clonaggio del DNA 
si compongono di quattro parti: la generazione di frammenti di DNA esogeni, l’in- 
serzione del DNA esogeno in un vettore, la trasformazione della molecola di DNA 
ricombinante in una cellula ospite nella quale essa può essere replicata, e un me- 
todo per selezionare o esaminare cloni per identificare quelli che contengono il ri- 
combinante di interesse. In questo capitolo vedremo alcuni dei problemi particolari 
e degli aspetti dei primi due passaggi nella formazione di librerie di DNA. Una li- 
breria di DNA è semplicemente una collezione di frammenti di DNA. 

Qui considereremo numerosi tipi diversi di librerie. Librerie di frammenti di 
DNA sono definite come librerie di DNA genomico o librerie di cDNA. I me- 
todi più tradizionali per la costruzione di librerie implicano il clonaggio fisico 
di vari frammenti di DNA in un vettore appropriato. Comunque, come vedremo 
dopo, frammenti di DNA che non sono clonati (es. quelli derivati da prodotti di 


Tabella 5.1. Alcuni genomi totalmente sequenziati = 
PS 
Organismo Dimensione Numero dei Numeri Referenza 
del genoma cromosomi di geni o 
(bp) (aploide dove codificanti pr 
appropriata) per proteine # 
D 
Methanococcus jannschii 1,7x 10° 1 1.750 (Bult et al., 1996) da 
(archaebatterio) 5 
Haemophilus influenzae (virus) 1,8x 10° Il 1.850 (Fleischman er al., 1996) Z 
Bacillus subtilis (batterio) 4,2x 10° 1 4.100 (Kunst et al., 1997) pi 
Escherichia coli (batterio) 4,6 x 10° 1 4.288 (Blattner et a/., 1997) 
Streptomyces coelicolor (actinomicete) 8,7 x 10° 1 7.825 (Bentley ez al., 2002) 
Schizosaccharomyces pombe (lievito) 1,4 x 107 3 4.824 (Wood er al., 2002) 
Saccharomyces cerevisiae (lievito) 1,4x 107 16 6.184 (Goffeau et al., 1997) 
Caenorhabditis elegans (verme) 0,97 x 107 6 19.000 (The C. elegans Sequencing 
Consortium, 1998) 
Drosophila melanogaster (moscerino 1,2x 108 4 13.500 (Adams et al., 2000) 
della frutta) 
Anopheles gambiae (zanzara 2,7 x 108 d 13.700 (Holt et al., 2002) 
della malaria) 
Arabidopsis thaliana (pianta) 1,2x 108 9 25.498 (The Arabidopsis Genome 
Initiative, 2000) 
Oryza sativa (riso) 4,3 x 108 12 - 50.000 (Yu et al., 2002; Goff et al., 2002) 
Mus musculus (topo) 25x10? 21 = 22.000 (Mouse Genome Sequencing 
Consortium, 2002) 
Homo sapiens (uomo) 2,9x 10° 23 — 32.000 (Lander et al., 2001; Venter et al., 
2001) 
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PCR) stanno diventando sempre più importanti negli esperimenti di ingegneria ge- 
netica. 

Una libreria di DNA genomico dovrebbe contenere copie rappresentative di 
tutto il materiale genetico di un singolo organismo. Librerie di questo tipo sono or- 
ganismo-specifiche, cioè una libreria costruita da qualsiasi tessuto di un singolo 
organismo dovrebbe contenere gli stessi frammenti di DNA di quelli derivati da 
qualunque altro tessuto. Tuttavia, librerie generate da organismi diversi, per esem- 
pio quelle derivate da topo e ratto, saranno diverse. Librerie di DNA genomico do- 
vrebbero contenere tutto il materiale genetico, indipendentemente dal tessuto o sta- 
dio di sviluppo nel quale il materiale è espresso. Le librerie genomiche conterranno 
quindi tutte le sequenze di DNA: geni espressi, geni non espressi, esoni e introni, 
promotori e terminatori e sequenze di DNA intergeniche. 

Le librerie di cDNA vengono costruite convertendo il mRNA di un particolare 
campione di tessuto in frammenti di DNA che possono essere clonati in un appo- 
sito vettore. Le librerie di cDNA contengono quindi solo la regione codificante di 
geni espressi in un campione di tessuto assieme a corte regioni delle porzioni 5” e 
3° non tradotte del gene. Di conseguenza, le librerie di cDNA isolate da diversi tes- 
suti dello stesso organismo potrebbero avere una composizione radicalmente di- 
versa. I geni espressi in un certo tipo di tessuto o in un determinato stadio di svi- 
luppo possono essere ben diversi da quelli espressi in un altro tessuto o stadio di 
sviluppo. Inoltre, la composizione di una libreria di cDNA riflette l'abbondanza re- 
lativa del mRNA nel campione di tessuto originario. Geni altamente espressi sa- 
ranno rappresentati nella libreria più volte, mentre geni espressi a bassi livelli sa- 
ranno rappresentati meno frequentemente. 


5.1 Librerie genomiche 


La più piccola unità di DNA in un genoma è il cromosoma. Anche negli organismi 
più semplici, tuttavia, i cromosomi contengono una quantità enorme di DNA. Per 
esempio, il cromosoma di £. coli contiene circa 4.6 Mbp (4.600.000 bp) di DNA 
(Tabella 5.1). Questa quantità di DNA è di gran lunga troppo lunga per essere clo- 
nata in qualsiasi vettore al momento disponibile (Capitolo 3). È quindi necessario, 
ed anche auspicabile, frammentare il DNA prima di clonarlo in vettore appropriato. 
Entra quindi in gioco una strategia del tipo “dividi e conquista”: infatti, è possibile 
assegnare una funzione specifica a frammenti relativamente piccoli del genoma, 
mentre il genoma intero è per lo più impenetrabile. Il metodo di frammentazione 
gioca un ruolo importante nella qualità della libreria finale. Idealmente il DNA ge- 
nomico dovrebbe essere rotto in frammenti casuali e sovrapposti prima del clonag- 
gio. Tale rottura assicura che la libreria contenga copie rappresentative di tutti i 
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frammenti del DNA presenti nel genoma, e che il taglio del DNA, limitato a siti 
specifici, non provochi uno sbilanciamento della rappresentatività dei frammenti. 
Nella costruzione di librerie genomiche vengono usati principalmente due metodi 
per tagliare il DNA. 


(a) Rottura meccanica. Il DNA genomico purificato viene fatto passare più volte 
attraverso un sottile ago da siringa oppure viene sottoposto a sonicazione per 
rompere il DNA in frammenti della lunghezza adatta al clonaggio. Tipica- 
mente, per clonare in vettori basati su À la dimensione media di un frammento 
di DNA dovrebbe essere di circa 20 kbp. Metodi meccanici come questi hanno 
il vantaggio che la frammentazione del DNA è casuale, ma necessitano, d’altra 
parte, di grandi quantitativi di DNA e la dimensione media dei frammenti di 
DNA è piuttosto variabile. 


(b) Digestione con enzimi di restrizione. Gli enzimi di restrizione, come EcoRI, 
spesso riconoscono sequenze di DNA di 6 bp e tagliano il DNA all’interno 
della sequenza di riconoscimento. In media, una sequenza di DNA di 6 bp sarà 
presente approssimativamente ogni 4.000 bp di DNA. La digestione completa 
del DNA genomico con EcoRI produrrà frammenti di DNA generalmente 
troppo corti per essere utili nella costruzione di una libreria genomica. Altri en- 
zimi di restrizione, per esempio Notl, riconoscono e tagliano sequenze di 8 bp. 
Tali sequenze saranno presenti molto meno frequentemente nel DNA (appros- 
simativamente una ogni 65 kbp). Tuttavia, il taglio con enzimi di restrizione 
per produrre frammenti di DNA pone dei problemi: infatti, se il gene che vo- 
gliamo clonare contiene più siti di riconoscimento per un particolare enzima di 
restrizione, i frammenti generati dopo digestione enzimatica potrebbero essere 
troppo corti per il clonaggio e di conseguenza il gene potrebbe non essere rap- 
presentato nella libreria. Per superare questo problema le librerie di DNA ge- 
nomico sono generalmente costruite trattando il DNA genomico con enzimi di 
restrizione in condizioni tali che la digestione non sia completa (Fig. 5.1). Le 
digestioni parziali garantiscono che non tutte le sequenze di riconoscimento nel 
DNA siano tagliate e, quindi, che la libreria prodotta contenga anche copie di 
geni che possiedono siti di restrizione multipli. In pratica, la digestione è nor- 
malmente effettuata utilizzando un enzima di restrizione, o spesso due, che ri- 
conosce e taglia sequenze molto comuni. Per esempio, come mostrato in Fi- 
gura 5.2, il DNA genomico ad alto peso molecolare è tagliato parzialmente con 
una miscela degli enzimi di restrizione Haelll e AluI. Ciascuno dei due enzimi 
riconosce una sequenza di 4 bp. Le loro sequenze di riconoscimento dovreb- 
bero quindi comparire nel DNA genomico, in media, ogni 256 bp. La dige- 
stione parziale, d’altra parte, limita il numero dei siti di restrizione effettiva- 
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(a) RE RE RE RE 


|Digestione completa 


Figura 5.1. Digestione completa e parziale di un frammento di DNA utilizzando un enzima di restri- 
zione. (a) La digestione completa assicura che tutti i siti di riconoscimento per l'enzima di restrizione 
(RE) siano tagliati. (b) La digestione parziale risulta nel taglio di un insieme casuale dei siti di restri- 
zione. La digestione parziale genera una varietà di prodotti, come indicato. 


mente tagliati e rende possibile la creazione di frammenti di DNA genomico di 
una dimensione adatta al clonaggio. I frammenti di DNA prodotti in questo 
modo hanno estremità piatte poiché sia Haelll che Alul tagliano il DNA in 
modo piatto: 


Haelll: 5°-GG| CC-3"  Alul: 5°-AG| CT-3' 
3'-CC | GG-5' 3'-TC | GA-5' 


I frammenti di DNA con estremità piatte possono essere problematici quando 
si tenta di clonarli. Come abbiamo già visto (Capitolo 2), la ligazione di DNA 
con estremità appiccicose è decisamente più efficiente che quella nelle quali le 
estremità del DNA sono piatte. Di conseguenza, sarebbe meglio generare, nel 
processo di clonaggio, frammenti di DNA genomico che contengano estremità 
appiccicose. Questo può essere ottenuto in due modi. . 


* Linkers o adattatori. Come mostrato in Figura 5.2, i frammenti di DNA ad estre- 
mità piatte possono essere legati ad una combinazione di oligonucleotidi che 
contiene il sito di riconoscimento per un enzima di restrizione (linker), oppure 
che possiede una estremità piatta, per la ligazione al DNA genomico, ed una 
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Figura 5.2. Costruzione di una libreria genomica. Vedi il testo per dettagli. 


estremità appiccicosa sporgente, per il clonaggio in un particolare sito di re- 
strizione (adattatore). Nel caso mostrato qui, i frammenti di DNA sono prima 
protetti dal taglio dell'enzima di restrizione mediante trattamento con una 
DNA metilasi specifica (Maniatis ef a/., 1978). Il trattamento dei frammenti di 
DNA con la metilasi di EcoRI, in presenza di S-adenosilmetionina, risulta 
nella metilazione del residuo di A più interno nel sito di riconoscimento di 
EcoRI (5°-GAATTC-3°). Il DNA modificato in questo modo non può essere ta- 
gliato dall’enzima di restrizione (vedi Fig. 2.1). AI DNA metilato viene poi ag- 
giunto un largo eccesso di linker oligonucleotidici in presenza di elevate con- 


ba 


ù 
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centrazioni di DNA ligasi. Il trattamento successivo con l’enzima di restrizione 
EcoRI causa il taglio del DNA solo all’interno delle molecole linker, che sono le 
uniche che contengono siti per EcoRI non metilati. I frammenti di DNA così ot- 
tenuti possono essere clonati nel sito EcoRI di un vettore appropriato. 


e Enzimi di restrizione che generano estremità appiccicose. Il DNA genomico può es- 
sere digerito fin dall'inizio con un enzima di restrizione che taglia frequentemente e 
che genera estremità appiccicose. Per esempio, la digestione del DNA genomico 
con l'enzima di restrizione Sau3AI (che riconosce la sequenza 5°-GATC-3°) genera 
frammenti di DNA che sono compatibili con le estremità appiccicose prodotte dal 
taglio del vettore con BamHI (che riconosce la sequenza 5°-GGATCC-3°). La faci- 
lità di questo secondo approccio lo rende di uso molto diffuso. 


Quando i frammenti di DNA sono stati prodotti, vengono clonati in un vettore ap- 
propriato. Spesso questo è un vettore basato su À ma, come abbiamo visto nel Ca- 
pitolo 3, sono disponibili una varietà di vettori per il clonaggio di frammenti di 
DNA di grosse dimensioni. Le combinazioni ricombinanti di vettore ed inserto 
vengono poi cresciute in £. coli così che dalla ligazione di un singolo frammento 
di DNA genomico nel vettore derivi una sola colonia batterica o una sola placca vi- 
rale. Le cellule di E. coli infettate con un fago 4 oppure trasformate con un DNA 
plasmidico sono incapaci di promuovere la replicazione di altre molecole dello 
stesso tipo. Di conseguenza, ciascuna placca di À o colonia batterica contiene copie 
multiple della stessa molecola di DNA ricombinante. Una libreria di queste mole- 
cole si produce raccogliendo un numero sufficiente di colonie o di placche, affin- 
ché ciascuna sequenza genomica sia rappresentata nella libreria almeno una volta, 
e mescolando tutto assieme. Il maggior vantaggio nel clonare frammenti grandi di 
DNA è che basta raccogliere meno colonie per ottenere una libreria rappresenta- 
tiva. Una domanda che è giusto porsi è quante colonie o placche singole vanno rac- 
colte per garantirsi che la libreria sia veramente rappresentativa del DNA genomico 
dal quale è stata preparata. La risposta dipende sia dalla dimensione del genoma 
dal quale è stata preparata la libreria, sia dalla dimensione media dei frammenti 
che sono stati clonati nella libreria. Per esempio, se si costruisce una libreria del 
genoma di E. coli (4.6 Mbp) con frammenti di 5 kbp, la frazione della dimensione 
del genoma rispetto alla dimensione media dei frammenti clonati (f) indica il nu- 
mero minimo di cloni che dovrebbe essere presente nella libreria: 
dimensione del genoma 4.600.000 bp 


pecca = = 920 
dimensione del frammento 5.000 bp 


Quindi, una libreria genomica di E. coli di questa dimensione dovrebbe contenere 
almeno 920 cloni indipendenti. Utilizzando lo stesso calcolo, una libreria geno- 
mica umana formata da inserti di dimensione simile richiederebbe almeno 580.000 


190 CLONARE UN GENE 5 


ricombinanti indipendenti per essere rappresentativa. Se la dimensione del fram- 
mento viene aumentata a 20 kbp, come è comune per i vettori 4, allora la libreria 
umana deve contenere almeno 145.000 cloni ricombinanti indipendenti per essere 
rappresentativa. Il rapporto tra dimensione del genoma e dimensione del fram- 
mento fornisce, però, una sottostima della complessità necessaria per la costru- 
zione di una libreria. Le librerie devono contenere un numero di ricombinanti 
molto più elevato di questo poiché alcune sequenze sarebbero inevitabilmente sot- 
torappresentate sia per errori casuali di campionamento, che come conseguenza 
delle sequenze stesse, il DNA clonato potrebbe essere relativamente tossico per la 
cellula ospite nella quale il vettore ricombinante viene replicato, oppure questo po- 
trebbe contenere sequenze che sono difficili da clonare, es. DNA altamente ripe- 
tuto. Verso la metà degli anni ‘70, Clarke e Carbon ottennero una formula che 
mette in relazione la probabilità (P) che una libreria casuale di N ricombinanti in- 
dipendenti contenga una qualsiasi sequenza di DNA (Clarke e Carbon, 1976): 


ln (1-P) 


In(1-+) 


dove f è il rapporto tra la dimensione del genoma e la dimensione del frammento, 
come descritto sopra, e In è il logaritmo naturale. Quindi, per raggiungere il 99 per 
cento di probabilità (P = 0,99) che qualunque sequenza casuale di DNA genomico 
umano sia presente in una libreria di frammenti di 20 kbp, N = 6.7 x 10°. In pra- 
tica, la maggior parte delle librerie genomiche umane contiene oltre un milione di 
cloni ricombinanti indipendenti. 

Riunendo assieme le placche o le colonie batteriche ricombinanti si produce 
una libreria primaria. I cloni ricombinanti sono semplicemente lavati via dalle 
piastre di crescita e raccolti in una provetta adeguata. La libreria dovrebbe conte- 
nere una copia rappresentativa di ciascuna molecola di DNA dalla quale è stata 
prodotta. Naturalmente, è possibile che alcune molecole di DNA non possano es- 
sere incluse nella libreria. Certe sequenze di DNA potrebbero essere tossiche per 
E. coli. Il DNA esogeno potrebbe 


N= 


* essere casualmente espresso in E. coli e la proteina o il frammento di proteina 
potrebbe essere dannoso per la crescita batterica, 


e funzionare come sito di legame per proteine di E. coli e sequestrarle così da im- 
pedire loro di svolgere la loro funzione naturale, 0 

* essere altamente ripetute ed essere eliminate dalla cellula batterica mediante ri- 
combinazione. 


La libreria primaria è normalmente a basso titolo e spesso abbastanza instabile. Per 
aumentarne la stabilità e il titolo, spesso si sottopone la libreria ad un passaggio di 
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amplificazione. In pratica, la collezione di fagi o colonie batteriche viene piastrata 
nuovamente, e la progenie risultante viene raccolta a formare una libreria amplifi- 
cata. La libreria amplificata è generalmente in un volume maggiore rispetto alla li- 
breria primaria, e di conseguenza può essere utilizzata anche centinaia di volte. Le 
collezioni riunite di fagi À possono essere mantenute praticamente in eterno. Le 
cellule batteriche che contengono dei plasmidi sono più difficili da conservare e 
spesso, dopo la ricrescita delle cellule batteriche congelate, si osserva un'elevata 
frequenza di perdita di cloni ricombinanti. L'amplificazione della libreria è essen- 
ziale se la libreria deve essere utilizzata più volte. Comunque, è possibile che il pro- 
cesso di amplificazione faccia sì che la composizione della libreria non rifletta vera- 
mente quella della libreria primaria. Come abbiamo già discusso, alcune sequenze 
di DNA possono essere relativamente tossiche per le cellule di E. coli; di conse- 
guenza, batteri che contengono tali cloni crescono più lentamente dei batteri che 
contengono sequenze di DNA che non disturbano la crescita. Queste sequenze pro- 
blematiche possono essere presenti nella libreria primaria, ma sono perse o sottorap- 
presentate dopo la fase di crescita necessaria per produrre la libreria amplificata. 


5.2 Librerie a cCDNA 


I genomi degli organismi eucariotici superiori sono molto grandi, e solo una pic- 
cola frazione del DNA codifica per geni. Il Progetto di Sequenziamento del Ge- 
noma Umano (Capitolo 9) ha stimato che i geni costituiscano solo circa il 1,5% del 
DNA contenuto nel genoma. La conoscenza dell’intero genoma è importante per 
comprendere il potenziale della cellula, cioè le proteine che la cellula potrebbe po- 
tenzialmente produrre, ma forse è più importante conoscere il contenuto di pro- 
teine che la cellula effettivamente produce. Tutte le cellule di un organismo sono 
derivate dalla stessa sequenza di DNA, ma il modo nel quale il genoma è trascritto 
e tradotto è unico per ciascun tipo cellulare, e per i singoli stadi di sviluppo di cia- 
scuna cellula. Anche se molti dei geni espressi in diversi tipi cellulari sono comuni, 
es. i geni codificanti per gli enzimi del ciclo TCA, alcuni sono differenti, es. alcuni 
dei geni espressi da una cellula della pelle sono diversi da quelli di una cellula mu- 
scolare. Questi geni espressi differenzialmente, e le proteine che questi producono, 
definiscono ciascun tipo cellulare. Quindi, il mRNA contenuto in una cellula ci 
fornisce un’immagine dei geni che sono espressi in quella cellula in un momento 
particolare. Il mRNA rappresenta solo una piccola frazione del RNA totale conte- 
nuto in una cellula (Tabella 5.2). 

La maggior parte dei geni eucariotici codificanti per proteine sono trascritti 
dalla RNA polimerasi II ed il mRNA risultante è generalmente sottoposto a diverse 
modificazioni post-trascrizionali, inclusa l'aggiunta di un cappuccio di 7-metilgua- 
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Tabella 5.2. Distribuzione delle molecole di RNA nella cellula. Negli eucarioti, la RNA polimerasi 
Il è responsabile per la produzione di circa il 60% dei trascritti di neosintesi. A causa della pro- 
pria instabilità, però, il mRNA si accumula ad un livello del 10% o meno (Brandhorst e McConkey, 
1974) 


RNA Abbondanza relativa (%) 

Sa E. coli Mammifero 
mRNA S 10 
tRNA ES 15 
rRNA 80 75 


nosina all’estremità 5”, e l'aggiunta di 100-200 residui di adenina (una coda polyA) 
all'estremità 3’ del trascritto (vedi Fig. 1.27). Inoltre, il mRNA va incontro a splicing 
per rimuovere gli introni, così che possa avvenire la traduzione di un messaggio 
singolo e contiguo. 

Il problema con il mRNA è che non è possibile mantenerlo in vettori stabili ed 
è difficile da manipolare. Di conseguenza, prima di poter costruire una libreria è 
necessario ottenere una copia a DNA (chiamata DNA complementare o cDNA) del 
mRNA. La conversione del RNA a DNA richiede l’azione della trascrittasi in- 
versa, un enzima che si trova nei retrovirus e che è responsabile della conversione 
del loro genoma a RNA in una copia a DNA prima della sua integrazione nel ge- 
noma della cellula ospite (Fig. 5.3). David Baltimore e Howard Temin scoprirono 
per primi, in maniera indipendente, l’enzima nel 1970 (Temin e Mizutani, 1970: 


Figura 5.3. Trascrittasi inversa. Struttura ai Raggi X, ad una risoluzione di 1.8 À, del cristallo di un 
frammento cataliticamente attivo della trascrittasi inversa del virus della leucemia murina di Moloney 
(MMLV-RT) (Georgiadis et a/., 1995). L'enzima è una DNA polimerasi RNA-dipendente che viene uti- 
lizzato nella conversione del MRNA in cDNA. 
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Baltimore, 1970). La trascrittasi inversa è una DNA polimerasi RNA-dipendente 
che, come le altre DNA polimerasi, catalizza l’aggiunta di nuovi nucleotidi ad una 
catena crescente in direzione 5’-3”. Le trascrittasi inverse generalmente possiedono 
due tipi di attività enzimatica. 


* Attività DNA polimerasica. Nel ciclo vitale dei retrovirus la trascrittasi inversa 
produce una copia di DNA dal RNA ma, quando viene usata in laboratorio, essa 
trascrive sia RNA a singola elica che stampi di DNA a doppia elica, essenzial- 
mente con la stessa efficienza. In entrambi i casi, è necessario un primer di DNA 
o di RNA per iniziare la sintesi. 


* Attività RNasiH. La RNasiH è una ribonucleasi che degrada I RNA in ibridi 
RNA-DNA, come quelli formati durante la trascrizione inversa di uno stampo a 
RNA. La RNasiH funziona sia da endonucleasi che da esonucleasi per idroliz- 
zare le sue molecole bersaglio. 


Tutti i retrovirus codificano per la propria trascrittasi inversa (RT), ma gli enzimi 
disponibili commercialmente e utilizzati per la costruzione di librerie di cDNA 
sono ottenute o dal virus della leucemia murina di Moloney (MMLV-RT) o dal vi- 
rus della mieloblastosi aviaria (AMV-RT), dopo purificazione dell’enzima da cel- 
lule infettate col virus o dopo espressione e purificazione da cellule di E. coli. En- 
trambi gli enzimi possiedono le stesse attività fondamentali, ma differiscono in al- 
cune caratteristiche, incluse la temperatura ed il pH ottimali. MMLV-RT è un sin- 
golo polipeptide di 71 kDa, mentre AMV-RT è composta da due catene polipepti- 
diche di 64 kDa e 96 kDa. Di maggiore importanza, MMLV-RT mostra un'attività 
RNasiH molto debole rispetto ad AMV-RT, che ha quindi un ovvio vantaggio 
quando è utilizzata per sintetizzare DNA da molecole lunghe di RNA. 

Il processo di produzione di una copia di cDNA a doppia elica a partire da una 
molecola di mRNA è mostrato in Figura 5.4. La presenza di una coda polyA è 
unica nel mRNA, e fornisce un sistema per distinguere ed isolare il mRNA dalle 
più abbondanti molecole di rRNA e tRNA. Il mRNA può essere isolato fisicamente 
dai suoi simili più abbondanti passando l’RNA totale su di una colonna alla quale 
sono legati polimeri di deossitimidina (oligo-dT). Le molecole di RNA che non 
contengono i residui multipli di adenina non sono in grado di attaccarsi e quindi 
passano direttamente attraverso la colonna. Le molecole di mRNA, d’altro canto, si 
legano alla colonna mediante appaiamento delle basi complementari e verranno 
eluite solo quando la concentrazione di sale che passa attraverso la colonna viene 
abbassata. 

Il clonaggio del cDNA inizia mescolando corti (12-18 basi) oligonucleotidi di 
dT con il mRNA purificato così che l’oligonucleotide si appai alla coda polyA 
della molecola di RNA. Si aggiunge poi la trascrittasi inversa che, in presenza dei 
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Figura 5.4. Costruzione di una libreria a cDNA. Vedi il testo per i dettagli 


quattro deossinucleotidi trifosfati (ANTPs), utilizza l’oligo-dT come primer per la 
sintesi di un cDNA a singola elica. Le molecole risultanti sono ibridi a doppio fila- 
mento di una molecola di cDNA ed una di mRNA. Un oligo-dT utilizzato per la 
sintesi dell’elica di cDNA possiede estremità eterogenee. Il primer si può appaiare 
in diverse posizioni lungo la coda polyA e quindi porterà alla produzione di cDNA 
di lunghezze diverse che possono derivare dalla stessa molecola di mRNA. Per su- 
perare questo problema, spesso si utilizzano primer ancorati. Oltre alla sequenza di 
12-18 basi dT, i primer ancorati sono costruiti in modo che l’estremità 3’ contenga 
un residuo di G, A o C (Liang e Pardee, 1992). Tali primer (ST YA dove V = 
G, A o C) avviano la replicazione del DNA in maniera efficiente solo se si ap- 
paiano all’estremità 5° della coda polyA, quando il residuo di G, A o C si può 
appaiare con il nucleotide immediatamente precedente la sequenza polyA. 

La produzione della seconda elica di DNA, come tutta la replicazione del 
DNA, richiede un primer per iniziare la sintesi. Tuttavia, a parte la coda polyA, le 
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molecole prodotte da geni diversi sono differenti. Quindi, è necessario un meccani- 
smo per iniziare la sintesi di DNA a partire dalle sequenze che corrispondono alle 
regioni 5° del mRNA. Le prime strategie di clonaggio dei cDNA implicavano la 
formazione nell’elica di cDNA di neosintesi di una forcina che potesse servire 
come una struttura di innesco per la formazione della seconda elica. La forcina ve- 
niva in seguito rimossa dal cDNA a doppia elica trattando con la nucleasi S1 (Ef- 
stratiadis et al., 1976). Tuttavia, tali metodi risultavano inevitabilmente nella per- 
dita di sequenze all’estremità 5’ dei geni, e quindi la seconda elica di DNA è nor- 
malmente sintetizzata dopo “nick translation” (spostamento del nick), o dopo l’ag- 
giunta di una coda omopolimerica. 


e Nick translation. La RNasiH viene utilizzata per digerire parzialmente la com- 
ponente a RNA degli ibridi RNA-DNA (Gubler e Hoffman, 1983). Il restante 
RNA è poi usato come innesco per la sintesi del DNA utilizzando la DNA poli- 
merasi I in presenza dei quattro ANTPs ed infine la DNA ligasi è utilizzata per 
sigillare tutte le incisioni rimaste nella struttura del DNA. La molecola di cONA 
prodotta può essere in seguito clonata in un vettore appropriato. 


e Aggiunta di una coda omopolimerica. Gli ibridi RNA-DNA formati dopo la sin- 
tesi della prima elica di cDNA sono trattati con l’enzima transferasi terminale 
in presenza di un singolo deossinucleotide trifosfato. La transferasi deossinu- 
cleotidil terminale (TdT) è una polimerasi indipendente dallo stampo che cata- 
lizza l'aggiunta di deossinucleotidi alle estremità 3° delle molecole di DNA 
(Chang e Bollum, 1986). L'attività TdT fu inizialmente identificata analizzando 
la ricombinazione (VDJ) delle immunoglobuline, nella quale furono trovati inse- 
riti tra i frammenti nucleotidi aggiuntivi extra, che non erano presenti in alcuni 
dei frammenti prima della fusione (Alt e Baltimore, 1982). La TdT si trova in 
concentrazioni elevate nel timo e nel midollo osseo dove avvengono tali eventi 
di ricombinazione, ma è commercialmente disponibile come proteina ricombi- 
nante prodotta e purificata da E. coli. Molecole di DNA (e di RNA) incubate con 
la TdT in presenza di dACTP avranno residui multipli di C aggiunti alle loro 
estremità 3’ (Fig. 5.4). Prima della sintesi della seconda elica di DNA bisogna 
rimuovere l’ RNA degli ibridi RNA-DNA per fornire uno stampo a singola elica 
per la nuova sintesi di DNA. Questo può essere facilmente ottenuto trattando gli 
ibridi con alcali. L’RNA viene idrolizzato in ribonucleotidi attorno a pH 11, 
mentre il DNA è resistente all’idrolisi fino a pH 13 (Watson e Yamazaki, 1973). 
Portando il pH fino a circa 12 quindi si ottiene l’idrolisi dell’ RNA, ma non del 
DNA. Le eliche complete di cDNA sono separate dai ribonucleotidi sulla base 
della loro dimensione, utilizzando la centrifugazione in gradiente di saccarosio. 
Le eliche di cDNA ottenute avranno residui di C multipli alle estremità 3’ e resi- 
dui di T multipli alle estremità 5’ (Fig. 5.4). La sintesi della seconda elica di 
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Figura 5.5. Il cDNA che deve essere espresso va clonato in un orientamento definito, così che 
l'elemento promotore al quale viene attaccato inizi la trascrizione dell'elica senso del DNA, e non 
dell’elica antisenso. 


cDNA inizia utilizzando un primer oligo-dG che si lega, appaiandosi alle basi 
complementari, alla sequenza polyC appena formata. La trascrittasi inversa, 
svolgendo il ruolo di una DNA polimerasi DNA-dipendente, in presenza dei 
quattro ANTPs produce la seconda elica di cDNA. 


L'aggiunta della coda omopolimerica ha un altro vantaggio: entrambe le estremità 5° 
e 3’ del mRNA originale, nel cDNA a doppia elica prodotto, sono marcate con se- 
quenze specifiche e note. Questo può essere estremamente utile quando sia necessa- 
rio clonare i frammenti di cDNA in un orientamento specifico, es. per l’espressione 
del cDNA. Le molecole di mRNA sono direzionali. L’estremità 5° rappresenta l’ini- 
zio della sequenza genica e la coda polyA in 3’ si trova alla fine della sequenza ge- 
nica. Quindi, se vogliamo esprimere il cDNA, per esempio in cellule batteriche, è 
importante garantirsi che venga trascritta solo l'elica senso del cDNA. Se l'elica an- 
tisenso è clonata a valle di un promotore batterico, il trascritto ottenuto (ammesso 
che venga prodotto) non codifica per la proteina desiderata (Fig. 5.5). 


5.3 Clonaggio direzionale di cONA 


La produzione di cDNA con oligonucleotidi modificati per promuovere l’innesco 
della sintesi di ciascuna elica di DNA permette l’inserimento di siti unici di re- 
strizione ad entrambe le estremità del cDNA. In questo modo il clonaggio dei 
frammenti di cDNA può avvenire in un’unica direzione (Fig. 5.6). Nell'esempio 
mostrato qui, il primer oligo-dT contiene all’estremità 5° anche sequenze addi- 
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Figura 5.6. Clonaggio direzionale del CONA. Primer modificati promuovono l’inizio della sintesi del 
DNA e ciò risulta nell’inserzione di una sequenza di riconoscimento per un enzima di restrizione alle 
estremità 5’ e 3’ del cDNA. 


zionali che codificano per un sito di riconoscimento per l’enzima di restrizione 
Xhol (5°-CTCGAG-3°). Come abbiamo discusso nel caso della PCR nel Capitolo 4, 
il primer inizia la sintesi del DNA e viene esso stesso incorporato nel prodotto di 
estensione. Un sito di restrizione Xhol viene quindi incorporato all’estremità 3” del 
cDNA. In maniera simile, il primer utilizzato per iniziare il secondo filamento di 
cDNA contiene, oltre alla sequenza oligo-dG, un sito di riconoscimento per l’en- 
zima di restrizione EcoRI (5°--GAATTC-3°) all’estremità 5°. Di conseguenza, il 
cDNA prodotto conterrà un sito EcoRI all’estremità 5” ed un sito Xhol all’estremità 
3”. La posizione di questi siti rende possibile il clonaggio direzionale del cDNA. Un 
plasmide dotato di un promotore adeguato seguito, in ordine, da un sito di ricono- 
scimento per EcoRI ed uno per Xhol potrà accettare in un solo orientamento i fram- 
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menti di cDNA tagliati. In questo modo il promotore potrà dirigere l’espressione 
del gene codificato dal cDNA e non della sequenza presente sull’elica opposta. 

Un problema ovvio nel tagliare il cDNA con enzimi di restrizione è che il 
cDNA stesso può contenere siti di restrizione. Anche in questo caso il problema 
può essere superato impiegando strategie simili a quelle che abbiamo già incon- 
trato nella costruzione delle librerie genomiche. Inoltre, l'utilizzo di forme metilate 
dei vari deossinucleotidi durante la sintesi del cDNA proteggerà le eliche di DNA 
neosintetizzate dal taglio da parte di alcuni enzimi di restrizione. Per esempio, il 
cDNA prodotto in presenza di ACTP metilato sarà resistente al taglio da parte di 
Xhol per la presenza di residui C metilati (Endow e Roberts, 1977). In alternativa, 
all’estremità dei frammenti di cDNA possono essere aggiunti siti di riconosci- 
mento per enzimi di restrizione che tagliano raramente, es. la sequenza di ricono- 
scimento per Notl (5°-GCGGCCGC-3°), riducendo la probabilità che l'enzima tagli 
all’interno del cDNA stesso. 

L'utilizzo di primer oligo-dT per l’innesco della sintesi di cDNA è stato di 
grande successo per la costruzione di diverse librerie di cDNA. L'approccio, comun- 
que, ha delle limitazioni. Il primer oligo-dT è adatto per la trascrizione inversa solo 
per molecole di mRNA con una coda polyA. Gli RNA procariotici e alcuni mRNA 
eucariotici non hanno code polyA (Adesnik et al., 1972). Quindi librerie di cDNA 
procariotici non possono essere prodotte con questo metodo e alcune sequenze po- 
trebbero non essere rappresentate in librerie eucariotiche. Inoltre, l’innesco iniziale 
all’estremità 3’ dei trascritti renderà più probabile la costruzione di librerie arricchite 
con frammenti di DNA che rappresentano le estremità 3’ dei geni, trascritti lunghi 
potrebbero quindi non essere totalmente rappresentati nella libreria. Questi problemi 
possono essere affrontati usando primer casuali per iniziare la sintesi della prima 
elica di cDNA. I primer casuali sono generalmente lunghi tra sei e nove nucleotidi e 
vengono sintetizzati come una miscela di tutte le basi possibili in ciascuna posizione 
(S-NNNNNN-3°). I primer casuali si appaieranno in posizioni casuali lungo il 
mRNA dove serviranno da innesco per la sintesi del DNA. Il cDNA clonato con que- 
sto metodo, dopo la sintesi della seconda elica, è probabilmente incompleto, ma i 
frammenti generati saranno più rappresentativi del mRNA di partenza. Sono stati svi- 
luppati metodi per clonare cDNA completi a partire da un frammento isolato da una 
libreria costruita con primer casuali (Frohman. Duch e Martin, 1988). 


5.4 Librerie basate su PCR 


La costruzione di librerie di cDNA di alta qualità richiede tempo ed è tecnicamente 
difficile. La stabilità e la durata di una libreria nella quale i frammenti di cDNA 
siano stati clonati in un vettore, unita alla possibilità di utilizzarla più volte, fa di 
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queste librerie una scelta comune per l’isolamento di cloni di cDNA. In molti casi, 
tuttavia, la necessità di produrre una libreria di cDNA clonati può essere evitata 
analizzando i prodotti di PCR ottenuti da mRNA. Questo tipo di approccio è possi- 
bile solo se la ricerca dei frammenti di DNA (Capitolo 6) viene effettuata mediante 
ibridazione di acidi nucleici e non è applicabile quando è richiesta l’analisi funzio- 
nale della proteina codificata. Nonostante ciò, le librerie basate sulla PCR sono fa- 
cili e rapide da costruire e analizzare. Le librerie basate su PCR sono costruite uti- 
lizzando una combinazione di trascrittasi inversa e PCR (RT-PCR) (Mocharla, 
Mocharla e Hodes, 1990). RT-PCR è sia sensibile che versatile: la tecnica può es- 
sere utilizzata per determinare la presenza o l'assenza di un trascritto, per stimare i 
livelli di espressione e per clonare cDNA senza che sia necessario costruire ed ana- 
lizzare una libreria di cDNA. 

Uno schema generale per la produzione di una libreria con RT-PCR da una po- 
polazione mista di molecole di mRNA sconosciute, è mostrata in Figura 5.7. La 
maggioranza dei protocolli di RT-PCR utilizzano la trascrittasi inversa per la pro- 
duzione della prima elica del cDNA (Murakawa et al., 1988). La produzione di una 
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Figura 5.7. RT-PCR per la produzione di una libreria di CONA amplificata. 
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singola elica di cDNA è sufficiente per passare allo stadio di PCR, quando la sin- 
tesi della seconda elica di cDNA e la successiva amplificazione vengono effettuate 
utilizzando una DNA polimerasi termostabile, come la Taq DNA polimerasi (vedi 
Capitolo 4). Oltre alla loro attività DNA polimerasica DNA-dipendente, alcune 
DNA polimerasi termostabili. come la DNA polimerasi di Thermus thermophilus 
(Tth), possiedono un'attività di trascrittasi inversa in presenza di ioni manganese. 
Questo ha portato allo sviluppo di protocolli che prevedono un singolo enzima per 
la trascrizione inversa e per l'amplificazione per PCR (Myers e Gelfand, 1991). 
Sono stati sviluppati anche sistemi nei quali la trascrizione inversa e l’amplifica- 
zione per PCR procedono nello stesso tampone. eliminando la necessità di ag- 
giunte secondarie alla miscela di reazione e riducendo le manipolazioni e la proba- 
bilità di introdurre contaminanti nella reazione (Wang. Cao e Johnson, 1992). Que- 
sti sistemi, utilizzando primer altamente specifici, sono ideali per l'amplificazione 
di molecole di cDNA le cui sequenze sono già note, ma la costruzione di una libre- 
ria rappresentativa amplificata richiede passaggi ulteriori per garantirsi che cia- 
scuna molecola di mRNA della popolazione sia rappresentata nella libreria. Sono 
stati sviluppati diversi metodi per amplificare tutte le potenziali specie di mRNA in 
un campione. Il metodo mostrato in Figura 5.7 utilizza gli stessi numerosi elementi 
che abbiamo già visto nella costruzione di una libreria di cDNA. La prima elica del 
cDNA è sintetizzata utilizzando la trascrizione inversa a partire da un primer oligo- 
dT che contiene all’estremità 5’ sequenza uniche aggiuntive. Il filamento di mRNA 
dell’ibrido RNA-DNA viene rimosso trattando con RNasiH. prima dell'aggiunta di 
residui multipli di C all’estremità 3’ della molecola di DNA con la transferasi termi- 
nale. La seconda elica di cDNA viene sintetizzata utilizzando un primer oligo-dG 
che, ancora una volta, possiede sequenze uniche all'estremità 5°. La DNA polime- 
rasi termostabile che verrà utilizzata nella reazione di PCR successiva può essere 
anche usata per la sintesi della seconda elica di cDNA. Le sequenze uniche che si 
troveranno alle estremità 3’ e 5’ del cDNA a doppia elica così ottenuto verranno uti- 
lizzate, durante la PCR. come siti di legame per primer che contengono tali se- 
quenze. I prodotti di PCR ottenuti conterranno un numero molto elevato di copie di 
ciascuna molecola di cDNA prodotta dalla reazione di trascrizione inversa. 


5.5 Librerie sottrattive 


Come abbiamo discusso precedentemente, molte delle molecole di mRNA prodotte 
da cellule differenti saranno le stesse. Per esempio, quasi tutte le cellule devono 
produrre gli enzimi richiesti per il metabolismo del glucosio, e molti dei compo- 
nenti intracellulari di tutte le cellule sono gli stessi. Quindi, potremmo volerci con- 
centrare solo sulle differenze tra tipi cellulari diversi per identificare geni che sono 
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Figura 5.8. Ibridazione sottrattiva di librerie basate su PCR. Vengono costruite due librerie di CONA 
basate su PCR. La libreria driver viene marcata con biotina, mentre la libreria tester non viene 
marcata. L’ibridazione delle due librerie assicura che le sequenze comuni siano marcate con biotina, 
mentre le sequenze uniche della libreria tester non sono marcate. Le sequenze marcate con biotina 
possono essere rimosse dalla miscela facendole legare all’avidina, causando quindi l'arricchimento 
delle sequenze uniche della libreria tester. Le sequenze arricchite possono essere amplificate per 
PCR utilizzando primer unici per la libreria tester. 
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specifici per un certo tipo cellulare, stadio di sviluppo o particolare stress ambien- 
tale. Il vantaggio delle librerie di cDNA basate sulla PCR è che sono suscettibili 
alla rimozione (sottrazione) di sequenza che sono comuni tra due librerie distinte. 
Questo provoca un arricchimento delle sequenze uniche e ne permette lo studio più 
facilmente. Un sistema per effettuare questa sottrazione è mostrato in Figura 5.8. 
Due librerie di cDNA basate su PCR vengono costruite da campioni di cDNA 
diversi. Una delle librerie (il driver) è prodotta utilizzando un oligonucleotide che 
ha un residuo di biotina aggiunto chimicamente. La biotina è un cofattore richiesto 
dagli enzimi implicati nelle reazioni di carbossilazione ATP-dipendente, es. acetil- 
CoA carbossilasi e piruvato carbossilasi (Fig. 5.9). La deficienza di biotina negli 
animali è rara, ma può essere osservata in seguito ad un consumo eccessivo di uova 
crude (Baugh, Malone e Butterworth, 1968). Il legame alla biotina di una proteina, 
chiamata avidina, presente nel bianco dell’uovo ne previene l'assorbimento intesti- 
nale (Fig. 5.9). Il complesso formato tra biotina e avidina è straordinariamente sta- 
bile (la costante di legame. K,- 1 x 10! M) e l’avidina può sequestrare la biotina 


Figura 5.9. Struttura della biotina e del complesso avidina-biotina. (a) Struttura molecolare della biotina. 
(b) il legame della molecola di biotina all’avidina. E mostrato un monomero di avidina con una molecola 
di biotina (blu) legata (Pugliese et a/., 1993). La molecola funzionale dell’avidina è un omotetramero. 


tn 
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efficientemente da qualsiasi soluzione tranne le più diluite (Green, 1963). La bio- 
tina può essere legata chimicamente a fosforamiditi (vedi Fig. 4.6) mediante il suo 
gruppo carbossilico e può quindi essere incorporata alle estremità 5°- e 3°- di pri- 
mer oligonucleotidici sintetizzati chimicamente, oppure lungo tutta la lunghezza 
del primer se è associata ad una delle basi. Inoltre, la biotina può essere aggiunta ai 
frammenti di DNA dopo la sintesi, utilizzando analoghi fotoattivabili della biotina 
(Barr e Emanuel, 1990). Oligonucleotidi e frammenti di DNA marcati con biotina 
hanno un'alta affinità per l’avidina. 


La libreria di cDNA driver viene denaturata per riscaldamento, allo scopo di 
separare le sue eliche singole, e poi viene ibridata in largo eccesso alla libreria di 
cDNA tester denaturata (Lugmani e Lymboura, 1994). La maggior parte delle mo- 
lecole di cDNA prodotte da questo trattamento riformeranno copie del cDNA dri- 
ver, che era presente in largo eccesso. Tuttavia, sono possibili diverse combinazioni 
di ibridazione tra il cDNA driver ed il cDNA tester: 


e molecole di cDNA presenti solo nel cDNA driver non potranno legare un fila- 
mento complementare del cDNA tester e riformeranno un cDNA a doppia elica 
dove ciascun filamento deriva della libreria driver. 


* molecole di cDNA presenti in entrambe le librerie possono ibridare tra loro e 
produrre ibridi nei quali un’elica deriva dal cDNA driver e un'elica deriva dal 
cDNA tester. 


e molecole di cDNA presenti solo nel cDNA tester non potranno legare molecole 
complementari dal cDNA driver e quindi formeranno DNA a doppia elica, dove 
ciascun filamento deriva dalla libreria tester. Va notato che, poiché queste mole- 
cole non contengono cDNA driver, non saranno marcate con biotina. Tutte le al- 
tre specie di DNA descritte sopra contengono almeno un filamento di DNA che 
possiede un gruppo biotinilato. 


La separazione fisica della molecole di cDNA ibrida è ottenuta passando le mole- 
cole di cDNA attraverso una colonna alla quale è stata attaccata dell’avidina. Tutte 
le specie di DNA contenenti una o due filamenti derivati dal cDNA driver reste- 
ranno attaccate alla colonna. Quindi, solo le specie derivate unicamente dal cCDNA 
tester non si attaccheranno alla colonna di avidina. L’amplificazione per PCR del 
campione che passa attraverso la colonna e del materiale trattenuto dalla colonna 
(dopo eluizione con biotina libera) porterà alla formazione di una libreria di sottra- 
zione ed una di selezione, rispettivamente. La libreria di sottrazione contiene se- 
quenze uniche alla libreria tester, che non sono presenti nella libreria driver, e la li- 
breria di selezione contiene sequenze condivise da entrambe le librerie (Fig. 5.10). 
L'utilizzo di librerie di sottrazione è una tecnica molto potente per arricchire le 
sequenza presenti solo nella libreria di cDNA tester. Per esempio, Brady et al. 
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Sottrazione 


Figura 5.10. Arricchimento di molecole di DNA durante l’ibridazione sottrattiva. La sottrazione della 
libreria driver dalla libreria tester risulta nell’eliminazione delle sequenze comuni (geni 1 e 2) e nel- 
l'arricchimento delle sequenze che sono più abbondanti nella libreria tester (geni 3-5). Qui sono mo- 
strati i gel di agarosio delle librerie colorati con bromuro di etidio (EtBr), e poi trasferiti e ibridati con 
sequenze di DNA per cinque geni diversi. L'intensità delle bande indica l'abbondanza del gene nella 
libreria. Le immagini sono cortesemente fornite da Gerard Brady e Abdulla Bashein, Epistem Lid. 


hanno analizzato il contenuto di mRNA di singole cellule di precursori ematopoie- 
tici durante il differenziamento delle cellule del sangue da progenitori nel midollo 
osseo (Brady er al., 1995). Essi hanno identificato 29 geni espressi in maniera dif- 
ferenziale che vengono attivati duranti diversi passaggi della via differenziativa. 


5.6 Costruzione di librerie nell'era post-genomica 


Lo scopo principale della costruzione di una libreria è l’identificazione di geni 
specifici. Si potrebbe pensare che una volta nota l’intera sequenza del genoma 
(Tabella 5.1), svanisca la necessità di avere librerie. Questo. tuttavia. è solo par- 
zialmente corretto. La conoscenza della sequenza del genoma umano non ci 
spiega la funzione della maggior parte dei geni. Librerie, come quelle descritte in 
questo capitolo, continueranno ad avere un ruolo importante nell’identificazione 
dei geni e nell’assegnazione ad essi di una funzione. Diverse organizzazioni com- 
merciali e non-profit forniscono l’accesso a tutti, o quasi tutti, i geni presenti in 
numerosi genomi interamente sequenziati (Tabella 5.1). Per esempio. lo Human 
Genome Mapping Project (http://www.hemp.mre.ac.uk) e il Mammalian Gene 
Collection (http://mgc.nci.nih.gov) forniscono, ad un prezzo nominale, un plasmide 
contenente una copia di cDNA di un gene specifico umano e di topo. Questi servizi 
eliminano la necessità di clonarsi geni già identificati o versioni complete di molecole 
di cDNA, quando siano state isolate delle forme incomplete da una libreria: d'altra 
parte il processo di identificazione del gene non viene accelerato da questi servizi. Le 
librerie continuano a costituire un punto chiave nell’identificazione di geni. 


Identificazione 
dei geni 


Concetti chiave 
+ Lo screening si basa su una proprietà unica di un clone in una libreria 


+ Se il DNA in un clone non è espresso, l’identificazione del gene deve 
basarsi solo sulla sequenza del DNA 


+ Le librerie di espressione possono essere analizzate per la sequenza 
della proteina (utilizzando anticorpi) o per la funzione della proteina 


+ Lo screening per interazioni tra proteine è utilizzato per individuare 
coppie di proteine, e complessi di proteine, che si associano fisica- 
mente 


Tentare di individuare un singolo clone ricombinante in una libreria di un milione 
di cloni differenti sembra un compito molto arduo. Nel Capitolo 3 abbiamo visto 
come i cloni ricombinanti possono essere selezionati, ad esempio per l’utilizzo di 
marcatori di resistenza ad antibiotici o la dimensione fisica come mezzi per sele- 
zionare vettori ricombinanti rispetto ai non ricombinanti. Tuttavia, identificare la 
sequenza specifica o la funzione della parte ricombinante di un clone è ancora più 
difficile. È necessario un qualche processo di selezione mediante il quale una mo- 
lecola può essere distinta da un’altra. La selezione di un singolo ricombinante può 
essere basata sulla sua sequenza o su qualche funzione del polipeptide codificato 
da quella sequenza. Il processo di selezione può essere basato su uno dei quattro 
criteri che seguono: 


e sequenza di DNA del clone 
e sequenza proteica del polipeptide codificato 
e funzione biochimica del polipeptide, oppure 


* capacità del polipeptide codificato dal clone ricombinante di interagire con altri 
polipeptidi. 
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Qui vedremo tutti questi metodi. Il miglioramento delle tecniche di sequenzia- 
mento del DNA (vedere Capitolo 9) ha portato ad una riduzione nell’utilizzo dell’i- 
bridazione tra acidi nucleici per identificare geni, mentre sono diventate più popo- 
lari diverse delle tecniche che ora descriveremo per identificare proteine e funzioni 
proteiche. 


6.1 Screening mediante ibridazione di acidi nucleici 


L’appaiamento tra basi complementari di un filamento di acido nucleico con un al- 
tro può essere utilizzato per identificare i cloni ricombinanti che contengono se- 
quenze di DNA identiche, o simili, alla sequenza di una sonda. I lettori realizze- 
ranno che un problema in questo tipo di approccio è che bisogna sapere qualcosa 
circa la sequenza che si vuole identificare, prima che possa essere progettata una 
sonda per cercare la sequenza stessa. Abbiamo già incontrato questo problema 
quando abbiamo parlato della progettazione dei primer per la PCR (vedere Capi- 
tolo 4). Nonostante ciò, l’ibridazione degli acidi nucleici è stata la tecnica fonda- 
mentale per l’identificazione di geni per molti anni. I vantaggi maggiori di questo 
tipo di analisi sono che non richiede l’espressione dei frammenti di DNA clonati 
nella libreria e che può essere applicata qualsiasi sia il sistema di vettori nel quale 
la libreria è stata clonata. 

La Figura 6.1 mostra uno schema generale dell’identificazione di cloni ricom- 
binanti basandosi solo sulla loro sequenza. Questo schema deriva da quello origi- 


Nitrocellulosa 


Sollevare il filtro Lisare i 
per produrre una batteri e 
replica delle colonie denaturare DNA legato 
= = il DNA 
2 = 
mente 
= (3) 
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Figura 6.1. Screening di sequenze di DNA mediante ibridazione di acidi nucleici. Un filtro di nitrocel- 
lulosa (o di nylon) viene depositato sulla superficie di una piastra di agar per generare una replica 
delle colonie batteriche. Il DNA dei batteri, che include la libreria ricombinante, si attacca alla mem- 
brana quando i batteri vengono lisati. Il DNA denaturato (a singola elica) può poi essere utilizzato 
come stampo per il legame di sequenze di DNA complementari e marcate radioattivamente. Il legame 
di tali sequenze alla membrana può essere rilevato esponendo il filtro su una lastra autoradiografica. 
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nariamente descritto da Grunstein e Hogness, ma include diverse modificazioni che 
permettono lo screening di un numero elevato di colonie batteriche partendo da 
una piastra unica, e utilizza una procedura di trasferimento su filtro (Grunstein e 
Hogness, 1975; Grunstein e Wallis, 1979; Hanahan e Meselson, 1980). L'idea di 
base in questo tipo di screening è di fissare il DNA contenuto in ciascun clone su 
un filtro di nitrocellulosa (oggi si utilizza il nylon) così che possa essere utilizzato 
come un substrato solido per il legame di altre molecole di DNA complementari. 
Le colonie che devono essere analizzate vengono fatte crescere su piastre di agar 
che contengono gli antibiotici appropriati etc. per permettere la crescita di cellule 
che contengono le molecole ricombinanti. Quando -le colonie sono cresciute, vi si 
depone sopra un foglio di nylon che poi viene rimosso producendo una replica 
della piastra. Una parte di ciascuna colonia batterica aderisce al filtro e viene ri- 
mossa dalla colonia. La replica subisce poi diversi trattamenti per lisare le cellule 
batteriche e promuovere l’adesione del DNA al filtro. Generalmente, i diversi pas- 
saggi sono: 


* il filtro di nylon viene trattato con alcali (es. 0,5 M NaOH) per lisare le cellule e 
denaturare il DNA; 


* dopo la neutralizzazione, il filtro viene trattato con proteasi (es. proteinasi K) 
per rimuovere le proteine e lasciare il DNA denaturato attaccato al filtro; 


* il filtro è poi incubato a 80 °C, o irraggiato con luce UV, per fissare il DNA alla 
membrana. 


Questi trattamenti producono un filtro che contiene una copia del DNA denatu- 
rato (a singolo filamento) presente in ciascuna colonia batterica originariamente 
cresciuta sulla piastra. La replica a singolo filamento può essere utilizzata come 
stampo per il legame di altre molecole di DNA. L’ibridazione al DNA sul filtro 
di una sonda a singola elica marcata indica la posizione delle colonie, sulla pia- 
stra originale, che contengono sequenze di DNA identiche, o almeno simili, a 
quella della sonda. Questa può essere costituita da qualsiasi sequenza di acido 
nucleico a singola elica e non deve necessariamente essere identica alla sequenza 
bersaglio. 

Un esempio di un clone ricombinante isolato utilizzando questo approccio è il 
cDNA codificante per una proteina implicata nella produzione della plasmina. La 
plasmina è una potente serina proteinasi che nei mammiferi svolge un ruolo impor- 
tante in diversi processi fisiologici, quali la degradazione di proteine della matrice 
extracellulare, la dissoluzione di coaguli sanguigni, la migrazione cellulare e la for- 
mazione di metastasi tumorali (Vassalli e Saurat, 1996). Nel plasma dei mammi- 
feri, la plasmina degrada i coaguli sanguigni generando prodotti solubili. La pla- 
smina è prodotta a partire da un precursore, il plasminogeno, mediante una proteo- 
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lisi limitata da parte degli attivatori del plasminogeno. Gli attivatori del plasmino- 
geno vengono utilizzati in clinica su pazienti che hanno avuto un attacco cardiaco, 
per prevenire ulteriori coaguli (Madhani, Mosowitz e Kotler, 1993). Agli inizi degli 
anni ‘80 l’attivatore del plasminogeno tissutale umano (t-PA) è stato purificato bio- 
chimicamente da cellule di melanoma e digerito con la proteasi tripsina. Alcuni dei 
frammenti proteici risultanti furono sottoposti a sequenziamento aminoacidico ed 
uno dei peptidi prodotti è mostrato in Figura 6.2. Utilizzando il codice genetico 
(vedere Appendice) furono determinate tutte le possibili sequenze di DNA che pos- 
sono codificare per tale peptide (Fig. 6.2). Delle 15 basi all’interno dei 5 codoni, 
solo quattro mostravano sequenze alternative potenziali. Quindi, Pennica et al. co- 
struirono una sonda antisenso degenerata di 14 nucleotidi, che conteneva una mi- 
scela delle otto sequenze differenti (Pennica er al., 1983). Usarono questa sonda in 
uno screening di una libreria plasmidica di cDNA costituita da 4.600 cloni prepa- 
rata da una linea cellulare di melanoma. Di questi, 12 furono selezionati come po- 
sitivi mediante ibridazione e, dopo averne sequenziato i DNA, uno dei cloni fu tro- 
vato contenere una sequenza che avrebbe potuto codificare il peptide. Questo pro- 
cesso ha portato all’isolamento del cDNA completo codificante la proteina t-PA. 
La sonda di DNA utilizzata in un esperimento di ibridazione deve essere omo- 
loga alla sequenza che si vuole identificare. In letteratura. ci sono diversi esempi 


Sequenza aminoacidica: 
-Trp-Glu-Tyr-Cys-Asp- 


Possibile sequenza di DNA: 
5°- TGG-GAA-TAT-TGT-GAT-3' 
G E G G 
Sonda: 
3'-ACC-CTT-ATA-ACA-CT-5° 
E G G 
Oligonucleotidi nella sonda: 


3’'-ACC-CTT-ATA-ACA-CT-5' 
3'-ACC-CTC-ATA-ACA-CT-5° 
3’-ACC-CTC-ATA-ACG-CT-5' 
3’-ACC-CTC-ATG-ACG-CT-5' 
3’'-ACC-CTT-ATG-ACA-CT-5' 
3’-ACC-CTT-ATA-ACG-CT-5' 
3’-ACC-CTT-ATG-ACG-CT-5' 


Figura 6.2. Progettazione di una sonda per l'isolamento dell’attivatore del plasminogeno tissutale 
umano (Pennica et al., 1983). È mostrata una sequenza di cinque aminoacidi della proteina. Tale se- 
quenza (che rappresenta gli aminoacidi 253-257 della proteina di 527 aminoacidi) è stata generata me- 
diante digestione con tripsina della proteina intera purificata. In base al codice genetico, è stata proget- 
tata una sonda degenerata che si lega a tutte le possibili sequenze di DNA codificanti per questo pep- 
tide. La sonda mostrata in giallo rappresenta quella esattamente complementare al gene isolato. 


| 
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nei quali il gene isolato da un organismo è stato utilizzato come sonda in ibrida- 
zione per identificare un gene omologo in una libreria di cDNA generata da un al- 
tro organismo. Per esempio, alcuni dei geni degli istoni codificati dal riccio di 
mare sono stati utilizzati per isolare i geni omologhi codificanti per gli istoni da 
una libreria di rana (Old et al., 1982). Come abbiamo visto sopra, sonde oligonu- 
cleotidiche degenerate di lunghezza approssimativa tra i 14 ed i 20 nucleotidi, sin- 
tetizzate chimicamente. possono essere utilizzate per identificare sequenze codifi- 
canti specifiche proteine. Nel caso del t-PA, discusso sopra, la sequenza peptidica 
generata poteva essere codificata solo da una sequenza di DNA tra poche alterna- 
tive, cioè la sequenza conteneva una degenerazione limitata. Altri aminoacidi sono 
codificati anche da sei codoni con triplette differenti. Per esempio, l’aminoacido 
leucina è codificato dalle seguenti triplette: CTA, CTC, CTG, CTT, TTA e TTG. 
Una sonda con una degenerazione elevata risulterà nel legame della sonda a se- 
quenze che non codificano per il gene bersaglio desiderato, mentre una sonda alta- 
mente specifica si legherà ad un numero relativamente ristretto di sequenze geni- 
che. Di conseguenza. le sequenze peptidiche che contengono aminoacidi come me- 
tionina e triptofano, che sono codificati da un’unica tripletta, sono particolarmente 
importanti quando si progettano queste sonde. Come abbiamo già visto per il 
Southern blotting (Capitolo 2), la stringenza dei lavaggi della sonda dalla mem- 
brana può essere utilizzata per modulare il numero delle ibridazioni che possono 
avvenire. 

Le sonde per ibridazione sono generalmente marcate radioattivamente per faci- 
litarne la rilevazione quando si legano alla membrana. Sonde oligonucleotidiche 
sintetizzate chimicamente possono essere trattate con l'enzima polinucleotide chi- 
nasi in presenza di y-**°P-ATP così che il gruppo fosfato radioattivo venga trasferito 
dalla molecola di ATP all’estremità 5° dell’oligonucleotide. Sono state sviluppate 
tecniche alternative che non prevedono la marcatura con sostanze radioattive, ad 
es. la marcatura con digossigenina (MeCreery, 1997); tali procedure sono utili in 
alcuni casi, ma la sensibilità e il potere di rilevazione ottenuti con la radioattività 
sono difficili da sorpassare. 


Lo screening di colonie, come descritto qui, può essere utilizzato per analizzare 
librerie plasmidiche o cosmidiche. Tuttavia, con solo qualche modificazione, può 
essere utile anche per lo screening di librerie in fago À (Benton e Davis, 1977). In- 
fatti, lo screening di placche di À è considerato migliore: 


e Quando si replicano placche invece che colonie batteriche, si trasferisce sul fil- 
tro meno DNA dell’ospite batterico e questo risulta in un fondo più pulito (meno 
ibridazione non specifica della sonda) quando si analizzano le placche di 4. 


e Le placche possono essere replicate diverse volte, così che dalla stessa piastra si 
possono effettuare screening multipli. 
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* Lo screening può essere effettuato ad una densità molto elevata analizzando 
placche piccole. Uno screening ad alta densità offre il vantaggio che in un sin- 
golo esperimento si può analizzare un numero elevato di ricombinanti per la pre- 
senza di sequenze omologhe alla sonda. Questo tipo di analisi significa, tuttavia, 
che difficilmente si otterrà un ricombinante singolo puro al primo giro di scree- 
ning. Come mostrato in Figura 6.3, lo screening con una sonda di una piastra di 
agar contenente 50.000 o più placche singole può generare uno o due segnali 
sulla lastra autoradiografica in corrispondenza della posizione dove si è legata la 
sonda. In questo caso, una regione di agar corrispondente alla posizione del se- 
gnale autoradiografico è stato rimosso dalla piastra originale e le diverse placche 
presenti sono state ri-piastrate ad una densità inferiore. L'analisi è poi stata ripe- 
tuta per generare una seconda ibridazione, che è arricchita per la placca che ri- 
sultava positiva nello screening iniziale. Spesso sono necessari due o tre scree- 
ning successivi prima che possa essere isolata una placca pura. 


Una estensione logica dello screening per ibridazione consiste nell’utilizzo della 
PCR con due primer per amplificare porzioni omologhe di geni, piuttosto che analiz- 


Secondo screening 


Figura 6.3. Passaggi successivi di screening per l'isolamento di un singolo ricombinante puro. Nello 
screening mediante ibridazione di una libreria in fago A, i positivi dal primo passaggio di screening 
ad alta densità vengono ri-piastrati e sottoposti nuovamente a screening a bassa densità. Questo 
consente l'isolamento di placche singole di ricombinanti puri. Immagini cortesemente fornite da 
Micheal Bromley e Jayne Brookman, F2G Ltd. 
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zare una libreria con un singolo oligonucleotide per cercare le sequenze omologhe. 
Il vantaggio maggiore di questo approccio è la rapidità. Non è necessario piastrare la 
libreria prima dello screening, poiché la reazione di PCR funziona utilizzando DNA 
nudo come stampo. Primer degenerati possono essere impiegati per amplificare por- 
zioni di geni omologhi dalla libreria (Takumi, 1997). I prodotti di PCR isolati rap- 
presentano, generalmente, solo una piccola porzione del gene. Tuttavia, il fram- 
mento isolato può essere impiegato come sonda altamente specifica in uno screening 
tradizionale per ibridazione, o come punto di partenza per amplificare le estremità 
5°- e 3‘- del gene utilizzando vari metodi di PCR (Frohman et al., 1988). 


6.2 Screening immunologico 


Se una libreria di frammenti di DNA è clonata in un vettore d'espressione (vedere 
Capitolo 3), il prodotto genico codificato dal DNA esogeno può essere prodotto al- 
l'interno della cellula ospite. Anche se la proteina non è totalmente funzionale, la 
sequenza del peptide espresso è probabilmente unica nella cellula ospite. Quindi, si 
possono utilizzare meccanismi per identificare queste sequenze polipeptidiche spe- 
cifiche per analizzare la libreria ed identificare cloni particolari. La rilevazione di 
sequenze polipeptidiche viene generalmente effettuata utilizzando anticorpi. Gli 
anticorpi sono relativamente semplici da produrre se è disponibile una proteina pu- 
rificata o anche solo parzialmente purificata. Il gene codificante per tale proteina 
può essere identificato utilizzando l’anticorpo nella procedura di screening rias- 
sunta qui sotto. Screening di questo tipo non richiedono che la proteina esogena 
espressa svolga una particolare funzione, ma necessitano che sia disponibile un an- 
ticorpo specifico per la proteina. 

Gli anticorpi vengono generati quando una proteina o un polipeptide esogeno 
viene iniettato in un animale. Spesso, l’animale utilizzato per produrre anticorpi da 
utilizzare in laboratorio è il coniglio o il topo, ma sono stati impiegati anche pecore, 
capre, maiali e cavalli per ottenere quantità di anticorpi maggiori (Harlow e Lane, 
1999). La presenza di una proteina esogena (antigene) negli animali è rilevata da 
recettori di superficie presenti sui linfociti B e T. Ciascuna cellula B possiede, sulla 
propria superficie, diverse migliaia di recettori differenti che sono capaci di legare 
antigeni particolari. Il legame dell’antigene al singolo recettore fa sì, attraverso un 
meccanismo complesso, che i discendenti di quella cellula B secernino notevoli 
quantità della forma solubile di quel particolare recettore. Questi sono gli anticorpi. 

Gli anticorpi sono glicoproteine composte da subunità contenenti due catene 
leggere (catene L) identiche, ciascuna di circa 200 aminoacidi, e due catene pesanti 
(catene H) identiche, di 400 aminoacidi ciascuna (Davies, Padlan e Sheriff, 1990). 
I circa 100 aminoacidi amino-terminali delle catene H e L variano molto da anti- 
corpo ad anticorpo, e sono chiamati regioni variabili (V). La variabilità della se- 
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Tabella 6.1. Le cinque classi di anticorpi (Harlow e Lane, 1999) 


Classe Catena H Catena L Struttura delle subunità 
IgA lo KOÀ (HL,), 

IgD lo) KOÀ H,L, 

IgE € KoOÀ HL, 

IgG y KOÀ H,L, 

IgM ul Kkoà (H,L,); 


quenza aminoacidica nelle regioni V è particolarmente pronunciata in tre siti iper- 
variabili (Fig. 6.4). La struttura terziaria dell’anticorpo porta vicine tra loro le tre re- 
gioni ipervariabili delle catene H e L, a formare un sito di legame per l’antigene. Alle 
estremità carbossi-terminali delle catene H e L — le regioni costanti (C) — si trovano 
solo poche differenze nelle sequenze aminoacidiche. I mammiferi producono due tipi 
diversi di regione C per le loro catene leggere, catene L kappa (x) e catene L lambda 
(4). Inoltre, vengono prodotte cinque diversi tipi di regioni C per le catene H: a (la 
catena pesante degli anticorpi IgA), y(IgG), é (I£D), € (IgE), e u (IgM). Ciascuna ca- 
tena H può appaiarsi con le catene L sia di tipo À che di tipo x (Tabella 6.1). Legami 
disolfuro covalenti mantengono le catene H e L accoppiate tra loro. 

Le molecole di anticorpi sono necessarie per svolgere due funzioni: devono ri- 
conoscere e legare l’antigene e poi indurre la risposta cellulare a quel determinato 
antigene. Le regioni V sono responsabili del riconoscimento dell’antigene, mentre 
le regioni C sono responsabili per l’induzione della risposta cellulare. I cinque tipi 
diversi di catene pesanti forniscono un meccanismo per ottenere risposte cellulari 
diverse ad uno stesso antigene (Wysocki e Gefter, 1989). 

La maggior parte degli anticorpi usati in laboratorio sono descritti come poli- 
clonali oppure monoclonali. Gli anticorpi policlonali vengono isolati dal siero di 


Figura 6.4. Struttura di un anticorpo. (a) Rappresentazione schematica della struttura di un anti- 
corpo. Le catene pesanti (rosso) e le catene leggere (blu) sono connesse tra loro da diversi ponti di- 
solfuro (linee nere). Sia le catene leggere che quelle pesanti posseggono, all'estremità amino-termi- 
nale, diverse regioni ipervariabili (arancione) che forniscono un’enorme varietà di siti di legame per 
l’antigene. (b) Struttura ai raggi X del cristallo di un anticorpo monoclonale. Sono mostrate le catene 
pesanti (giallo e blu) e le catene leggere (verde e rosso) (Harris et a/., 1992). (c) Anticorpo a catena 
singola costituito dalla regione variabile (scFv, Single-chain antibody variable region fragment anti- 
body). Le regioni variabili delle catene pesanti e leggere possono essere ingegnerizzate in modo 
da essere espresse come un polipeptide singolo collegato da uno spaziatore di 15 aminoacidi (di 
sequenza (glicina,serina),), che possiede una flessibilità sufficiente per permettere ai due domini di 
assemblare un sito di legame per l’antigene funzionale. 
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un animale immunizzato e contengono molti anticorpi diversi che riconoscono epi- 
topi differenti dello stesso antigene. Gli anticorpi monoclonali vengono prodotti da 
cellule clonali ed isolate e riconoscono un singolo epitopo specifico in un antigene. 
Anticorpi che legano proteine possono riconoscere epitopi continui (es. la se- 
quenza aminoacidica primaria della proteina) oppure discontinui. Un epitopo di- 
scontinuo è formato dal ripiegamento della proteina a generare un’area superficiale 
antigenica che è composta da diversi segmenti della struttura primaria. La maggior 
parte degli epitopi in natura sono di tipo discontinuo, anche se spesso gli anticorpi 
che si usano in laboratorio vengono prodotti utilizzando proteine denaturate per ga- 
rantirsi di ottenere anticorpi che riconoscano epitopi continui e possano quindi es- 
sere utilizzati per rilevare le proteine denaturate mediante western blotting (Capi- 
tolo 2). Anche se l’utilizzo degli animali per la produzione di anticorpi ad affinità 
elevata è ancora molto diffuso, sono disponibili diversi protocolli per la selezione e 
la produzione in cellule batteriche di frammenti di anticorpi specifici (Hexham, 
1998; Portner-Taliana et al., 2000: Daugherty er al., 1999). 

In Figura 6.5 è mostrato uno schema generale per lo screening immunologico 
di una libreria di DNA. Il cDNA è clonato nel vettore di espressione AZAP (vedere 
Capitolo 3) così che il DNA esogeno sia posto sotto il controllo del promotore 
batterico /ac. La miscela di fagi À ricombinanti è piastrata con un ospite batterico 
appropriato su piastre di agar. Le piastre che contengono la libreria fagica sono in- 
cubate fino alla comparsa di piccole placche. A questo punto, sulle placche viene 
appoggiato un foglio di nitrocellulosa, precedentemente impregnato di IPTG, l’in- 
duttore gratuito del promotore /ac. Il filtro viene lasciato sulla piastra per quattro 
ore sia per indurre l’espressione dei polipeptidi codificati dal cDNA, che per legare 
le proteine che vengono prodotte quando le cellule di £. coli lisano, come conse- 
guenza dell’infezione fagica. Il filtro di nitrocellulosa è poi rimosso dalla piastra e 
conterrà, attaccate alla propria superficie, le proteine che erano state espresse in cia- 
scuna placca. I filtro viene poi incubato con un anticorpo specifico per la proteina 
codificata dal gene che si vuole trovare. L’anticorpo si dovrebbe legare alla nitrocel- 
lulosa solo nella posizione corrispondente a quella occupata, sulla piastra di agar 
originale, dalla placca che esprimeva quella proteina specifica. Il filtro viene quindi 
lavato per rimuovere gli anticorpi non legati e successivamente incubato con un an- 
ticorpo secondario marcato, per rilevare la presenza dell’anticorpo primario legato. 

In origine, i metodi di screening immunologico prevedevano l’impiego di anti- 
corpi primari marcati radioattivamente, per rilevare il legame degli anticorpi alla ni- 
trocellulosa (Broome e Gilbert, 1978). Tali metodi sono stati sostituiti dall'utilizzo di 
sandwich di anticorpi, come descritto sopra. L’anticorpo secondario riconosce la re- 
gione costante dell’anticorpo primario ed è, inoltre, coniugato ad un enzima facil- 
mente saggiabile. Tali enzimi, ad esempio la perossidasi di rafano o la fosfatasi alca- 
lina (Mierendorf, Percy e Young, 1987: de Wet er al., 1984), possono essere saggiati 
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Figura 6.5. Screening immunologico di una libreria in fago A. Vedere il testo per i dettagli. 


direttamente sul filtro di nitrocellulosa per produrre o una variazione colorimetrica, 
oppure possono essere impiegati in reazioni associate all'emissione di luce così che 
il legame dell’anticorpo possa essere rilevato utilizzando una lastra autoradiografica. 
Poiché più molecole di anticorpo secondario possono legare ciascuna molecola di 
anticorpo primario, i sandwich di anticorpi producono segnali amplificati. 

Lo screening immunologico resta una tecnica ampiamente utilizzata per identi- 
ficare geni partendo da proteine disponibili. Per esempio, Liu et al. hanno purifi- 
cato la uridina fosforilasi (un enzima che catalizza la fosforolisi reversibile dell’u- 
ridina ad uracile) da un tumore del colon (Liu et al., 1998). Sono stati poi prodotti 
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in coniglio anticorpi contro la proteina purificata e sono stati utilizzati in uno 
screening di una libreria di espressione di cDNA di fegato umano. Questo ha por- 
tato all’isolamento di un clone di 1.2 kbp che conteneva l’intera sequenza codifi- 
cante del gene della uridina fosforilasi umana. 

Uno screening su membrana basato sulla funzione della proteina, a volte chia- 
mato screening south-western, è stato utilizzato con notevole successo per identifi- 
care geni codificanti per proteine che legano il DNA. Uno screening di questo tipo 
viene effettuato come schematizzato in Figura 6.5, eccetto che, invece di incubare la 
membrana di nitrocellulosa con un anticorpo, si utilizza una molecola di DNA a 
doppia elica, a sequenza nota, marcata radioattivamente (Singh er a/., 1988). Le pro- 
teine che sono in grado di legare tale sequenza, spesso derivata dal promotore di un 
gene, legheranno il DNA alla membrana, e la loro posizione può essere individuata 
utilizzando una lastra da autoradiografia. Questo approccio richiede che il legame al 
DNA possa avvenire sulla membrana e necessita inoltre che l’attività di legame al 
DNA sia contenuta in un unico polipeptide. Ciononostante. è stato utilizzato per iso- 
lare numerose proteine capaci di legare il DNA (Vinson er al.. 1988). 


6.3 Screening basato sulla funzione 


Lo screening di librerie di cDNA mediante anticorpi, descritto sopra, richiede solo 
l’espressione delle sequenze codificate dai cDNA e non richiede necessariamente 
l’espressione di una proteina totalmente funzionale. Lo screening può, tuttavia, es- 
sere effettuato per identificare una specifica funzione proteica nella cellula ospite. 
Perché questo tipo di screening abbia successo, è necessaria una cellula ospite che 
sia priva della funzione biochimica per la quale si vuole selezionare, oppure una 
cellula difettiva in una qualche funzione che possa essere compensata dalla pro- 
teina prodotta dalla libreria di espressione. Questa complementazione funzionale 
è particolarmente utile nell’identificazione di geni da un organismo che svolgono 
ruoli simili a quelli svolti dal gene difettivo in un altro organismo. Per esempio. 
cellule di E. coli che contengono una copia difettiva del gene /isB, codificante per 
l'enzima imidazolo glicerolo fosfato deidratasi che è essenziale per la biosintesi 
dell’aminoacido istidina, non possono crescere su un terreno privo di istidina. Se 
cellule di E. colî difettive in hisB vengono trasformate con una libreria di espres- 
sione di lievito e piastrate su terreno privo di istidina, le uniche cellule in grado di 
crescere saranno quelle che producono una copia funzionale dell'enzima di lievito, 
codificato dal gene 77/53 (Ratzkin e Carbon, 1977). I geni H#/S3 di lievito e /isB di 
E. coli mostrano una omologia di sequenza molto bassa (meno del 20% di identità 
totale a livello aminoacidico), ma le proteine codificate, anche se diverse in se- 
quenza aminoacidica, svolgono la stessa funzione enzimatica. 
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Il clonaggio sulla base della funzione ha avuto molto successo nell’isolamento 
di geni di eucarioti superiori come omologhi funzionali di geni presenti in cellule 
di eucarioti inferiori, più facili da manipolare sperimentalmente. Per esempio, 
molti geni di eucarioti superiori sono stati isolati sulla base della loro capacità di 
complementare mutazioni nei corrispondenti geni di lievito. Questi includono: 


e i geni codificanti per diversi enzimi metabolici umani, riassunto da Botstein e 
Fink (1988). 


e il gene della topoisomerasi II di Drosophila (Wycoff e Hsieh, 1988). 


* diversi fattori trascrizionali della RNA polimerasi II umana (Becker et al., 
1991). e 


e geni del ciclo cellulare di topo (Martegani et al., 1992). 


Il problema maggiore in questo genere di screening è che deve essere disponibile 
una mutazione testabile nella cellula ospite, che possa essere complementata dal- 
l’espressione del gene esogeno. Inoltre, le mutazioni potrebbero non essere com- 
pensate completamente dal gene esogeno; per esempio, il gene esogeno potrebbe 
essere solo parzialmente funzionale nella cellula ospite. Un gene esogeno potrebbe 
non essere espresso nella cellula ospite, oppure la proteina prodotta potrebbe non 
essere modificata post-traduzionalmente in maniera corretta per produrre la forma 
attiva. Inoltre, poiché la costruzione della libreria generalmente risulta nel clonag- 
gio di singoli geni nei vettori, se la produzione della proteina attiva richiede due 0 
più prodotti genici esogeni, è probabile che lo screening per complementazione 
non funzioni. 

I geni possono essere clonati grazie all'acquisizione di una funzione, se le pro- 
teine espresse sono capaci di conferire alla cellula ospite un nuovo fenotipo. Per 
esempio, gli oncogeni cellulari possono essere isolati da librerie di DNA umano 
basandosi sulla loro capacità di stimolare la proliferazione cellulare di cellule in 
coltura (Brady et al., 1985). Questo screening per acquisizione di funzione ha un 
numero limitato di applicazioni, ma è un metodo molto potente per identificare 
geni specifici. 


6.4 Screening per interazione 


La maggior parte delle proteine non sono presenti in cellula come entità singole, 
ma spesso interagiscono con numerose altre proteine che ne regolano la funzione 0 
che costituiscono con esse complessi funzionali più grandi (Legrain e Selig, 2000). 
Una volta clonato un gene codificante per una proteina, quindi, potremmo volere 
verificare con quali altre proteine questa interagisce. 
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6.5 Esposizione su fago (Phage Display) 


Il phage display è una tecnica potente per l’identificazione di peptidi o proteine 
che legano altre molecole. Il DNA codificante un gene specifico o una libreria di 
frammenti di cDNA viene clonata nel genoma del batteriofago M13, nella stessa 
cornice di lettura del gene 3 (vedere Fig. 3.15), codificante per pIII, la proteina 
più piccola del capside. Questo fa sì che il peptide o la proteina espressa sia 
esposto sulla superficie della particella fagica come una fusione con la pIII en- 
dogena (Smith, 1985). Il phage display, quindi, crea un legame fisico tra una li- 
breria di sequenze peptidiche casuali ed il DNA codificante ciascuna sequenza, e 
permette l’identificazione rapida dei ligandi peptidici per una varietà di mole- 
cole bersaglio (anticorpi, enzimi, recettori di superficie, etc.) mediante un si- 
stema di selezione în vitro chiamato “panning”. Nella sua forma più semplice, il 
“panning” prevede l’incubazione della libreria di peptidi esposti su una piastra 
(o delle palline) ricoperta dal bersaglio, seguita da una serie di lavaggi per elimi- 
nare i fagi non legati, mentre quello legato viene eluito successivamente. Questo 
fago viene poi amplificato e fatto passare attraverso cicli successivi di sele- 
zione/amplificazione allo scopo di arricchire la popolazione che lega la molecola 
bersaglio. Dopo tre o quattro cicli, cloni singoli vengono caratterizzati per se- 
quenziamento. Il phage display è stato utilizzato per identificare peptidi che le- 
gano recettori, substrati o inibitori di enzimi, epitopi, anticorpi migliorati, en- 
zimi alterati e cloni di cDNA (O°Neil e Hoess, 1995). Librerie di peptidi casuali 
esposte sulla superficie del fago sono state utilizzate in diverse applicazioni, in- 
cluso la mappatura di epitopi, la mappatura di regioni di contatto tra proteine, e 
l’identificazione di peptidi che mimano ligandi non peptidici. Ad esempio, Beck 
et al. hanno usato una libreria di peptidi casuali per selezionare substrati della 
HIV-1 proteasi (Beck et a/., 2000), riuscendo ad identificare peptidi che vengono 
tagliati 200 volte più efficientemente rispetto alla sequenza selvatica. Tali pep- 
tidi potrebbero essere utili per progettare inibitori altamente specifici della pro- 
tesi stessa. 


6.6 Screening mediante two-hybrid (doppio ibrido) 


Lo screening di interazioni molecolari mediante il metodo del doppio ibrido si basa 
sulla struttura modulare degli attivatori trascrizionali della RNA polimerasi II degli 
eucarioti. I fattori trascrizionali consistono di almeno due domini proteici, un do- 
minio di legame al DNA sequenza-specifico (DBD), che gli permette di legarsi ai 
promotori di geni specifici, ed in un dominio di attivazione (AD), che funziona da 
sito per il reclutamento di diversi complessi proteici necessari per la trascrizione 
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del gene. Nel 1985, si scoprì che proteine di fusione, composte dal dominio di le- 
game al DNA di una proteina unita al dominio di attivazione di un’altra proteina, 
erano in grado di funzionare da attivatori trascrizionali (Brent e Ptashne, 1985). 
Questo indicava che, per l’induzione della trascrizione, non era necessario un le- 
game preciso tra le funzioni di legame al DNA e di attivazione, ma che i due do- 
mini separati della proteina potevano funzionare indipendentemente uno dall’altro. 
In molti attivatori trascrizionali le funzioni DBD e AD si trovano all’interno dello 
stesso polipeptide ma in parti separate, e separabili, della proteina. Entrambe que- 
ste funzioni sono essenziali perché avvenga la trascrizione. Altri fattori trascrizio- 
nali sono composti da due o più subunità dove un polipeptide funziona da DBD e 
un altro funziona da AD (O'Reilly et al., 1997). In questi casi, interazioni proteina- 
proteina mantengono assieme il DBD e 1’ AD, formando un attivatore trascrizionale 
funzionale. 

Consideriamo in dettaglio la struttura di uno specifico attivatore trascrizionale 
(Fig. 6.6); la proteina di lievito Gal4p che è spesso considerata come l’archetipo di 
un attivatore trascrizionale. Gal4p attiva i geni della via metabolica di Leloir, 
quando le cellule di lievito devono metabolizzare il galattosio quale loro unica 
fonte di carbonio (Reece e Platt, 1997). Torneremo a parlare di questa via metabo- 
lica e della sua importanza nell’ingegneria genetica nel Capitolo 11. Gal4p è un 
singolo polipeptide costituito da 881 aminoacidi. La proteina è divisa in regioni di- 
stinte, con il DBD all’estremità amino-terminale e 1 AD all'estremità carbossi-ter- 
minale della proteina (Ma e Ptashne, 1987b). 


* Gli aminoacidi 1-65 formano un dominio chiamato cluster binucleare Zn(II),Cysg 
(Todd e Andrianopoulos, 1997), nel quale due atomi di zinco sono trattenuti al- 
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Figura 6.6. Struttura a domini dell’attivatore trascrizionale Gal4p di lievito. La proteina è composta 
da due domini principali, un dominio di legame al DNA e di dimerizzazione posizionato all'estremità 
amino-terminale, ed un dominio di attivazione posizionato all'estremità carbossi-terminale. 


220 IDENTIFICAZIONE DEI GENI 6 


Figura 6.7. Struttura dei 65 aminoacidi amino-terminali di Gal4p legati al DNA, determinata me- 
diante cristallografia a raggi X (Marmorstein et al., 1992). Il DNA (rosso) è contattato dal dimero di 
proteina su ciascun lato della doppia elica. Le sequenze di riconoscimento del DNA sulla proteina 
assumono una conformazione a cluster binucleare Zn(Il),Cycg, che è mantenuto da due atomi di 
zinco (giallo). L'inizio della superficie di dimerizzazione coiled-coil (residui 49-64) si può vedere nella 
struttura cristallografica e si estende lontano dall’elica. 


l'interno della proteina da sei residui di cisteina (Fig. 6.7). Questa regione della 
proteina interagisce direttamente con il DNA in corrispondenza di una sequenza 
specifica chiamata UAS, —sequenza a monte attivatoria per il galattosio. Questa 
sequenza (5°-CGGN, ,CCG-3°), dove N può essere qualunque nucleotide) si 
trova, spesso in copie multiple, 50-200 bp a monte del sito di inizio della trascri- 
zione dei geni regolati dal galattosio (Ginniger, Varnum e Ptashnne, 1985). 


Gli aminoacidi 65-994 formano un motivo coiled-coil che è responsabile della 
dimerizzazione della proteina. 


Gli aminooacidi 768-881 formano il dominio AD principale. Come tutti i domini 
di attivazione di lievito, la regione è acida, contiene cioè una preponderanza di 
aminoacidi carichi negativamente (Ma e Ptashne, 1987c), L’acidità non è, tutta- 
via, l’unico determinante nel definire un dominio di attivazione o la sua forza re- 
lativa. Tali domini sono per lo più non strutturati, con aminoacidi acidi e idrofo- 
bici che contribuiscono al potenziale attivante (Triezenberg, 1995). Gal4p pos- 
siede anche un dominio AD addizionale posizionato tra gli aminoacidi 148 e 
196. Questa regione è un attivatore debole e il suo contributo alla funzione della 
proteina non è ancora chiaro. 


Gli aminoacidi 851-881 formano anche il sito di legame per un repressore tra- 
scrizionale, Gal80p, che modula l’attività di Gal4p (Ma e Ptashne, 1987a; John- 
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ston, Salmeron e Dincher, 1987). Il legame di Gal$0p a questo sito sembra man- 
tenere l'estremità carbossi-terminale di Gal4p in un orientamento tale da non 
permettere l’attivazione trascrizionale. 


Lo screening di interazioni usando i fattori trascrizionali si basa sull’osservazione 
che l’espressione in cellula del solo DBD o del solo AD non è sufficiente per in- 
durre l'attivazione trascrizionale (Ma e Ptashne, 1987b). Uno schema generale di 
questo screening è mostrato in Figura 6.8. Il DBD di Gal4p è sufficiente per le- 
gare UAS;. ma la mancanza di un'AD gli impedisce di reclutare la RNA polime- 
rasi e di attivare l’espressione genica. In modo simile, I AD di Gal4 da solo non 
attiva l’espressione genica perché la proteina non può essere indirizzata a geni par- 
ticolari. Se, invece, il DBD e AD possono essere collegati fisicamente in qualche 
modo, es. mediante l'interazione proteina-proteina di polipeptidi ad essi fusi, allora 
si otterrà la formazione di un attivatore funzionale, nel quale il DBD è collegato al- 
lAD, e si avrà attivazione genica. 


Figura 6.8. Lo screening two-hybrid. (a) Una proteina ibrida composta dal dominio di legame al 
DNA (DBD) di Gal4p e da una proteina esca (X) è in grado di legare il promotore del gene reporter 
ma non di attivarlo. (b) Una proteina ibrida composta dal dominio di attivazione (AD) di Gal4p e 
di una proteina preda (Y) non può attivare la trascrizione perché non è in grado di legare il DNA. 
(c) L'espressione di entrambe le proteine ibride può risultare nella ricostituzione di un attivatore tra- 
scrizionale funzionale e, quindi, nell'espressione del gene reporter, se le proteina esca e preda inte- 
ragiscono tra loro. 
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Nel 1989 Stanley Fields e Ok-kyu Song usarono per la prima volta questo si- 
stema di attivatore trascrizionale diviso per rilevare interazioni proteina-proteina in 
cellule di lievito (Fields e Song, 1989). Essi costruirono plasmidi per l’espressione 
in lievito nei quali le sequenze geniche codificanti per il DBD di Gal4p o per AD 
di Gal4p erano fuse alle sequenza geniche codificanti altri polipeptidi (Fig. 6.9). 
Questo risultava nella produzione di proteine ibride che portano o il DBD o l’AD 
di Gal4p. Se queste proteine vengono espresse individualmente nelle cellule, nes- 
suna è in grado di attivare l’espressione genica. Inoltre, se le due proteine di fu- 
sione vengono espresse insieme nella stessa cellula, ma i due polipeptidi fusi al 
DBD e all’ AD non interagiscono, non si avrà attivazione genica. Se, invece, i poli- 
peptidi fusi al DBD e all’ AD interagiscono tra loro, allora le funzioni del DBD e 
dell’AD verranno portate assieme mediante questa interazione proteina-proteina e 
si otterrà attivazione genica (Fig. 6.8). Cioè, si avrà espressione genica solo se le 
due proteine ibride sono in grado si interagire tra loro. 

Malgrado l’attivazione dei geni del metabolismo del galattosio, naturalmente 
regolati da UAS;, possano essere utilizzati per rilevare interazioni proteina-pro- 
teina produttive (Fields e Song, 1989), è più conveniente analizzare l’espressione 
di un prodotto genico più facilmente rilevabile. Uno dei vantaggi nel portare avanti 
lo screening per interazioni molecolari in lievito è che sono disponibili numerosi 
reporter, questi includono quelli mostrati in Tabella 6.2 e diversi geni nutrizionali 
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Figura 6.9. Plasmidi per la produzione delle fusioni con il dominio di legame al DNA e con il dominio 
di attivazione, necessarie per lo screening two-hybrid. Un plasmide produce l’ibrido con la fusione 
con il DBD e l’altro produce l’ibrido con la fusione con l’AD. Entrambi i geni per le proteine ibride 
sono espressi da un promotore costitutivo forte (ADH1) e sono contenuti su un plasmide ad alto 
numero di copie che porta la sequenza 2 Lu. Diversi geni nutrizionali (7TRP1 e URA3) permettono la 
selezione nelle cellule di lievito. 


Tabella 6.2. Geni reporter comunemente utilizzati 


Gene Proteina Dimensione Fonte originale Rilevamento Referenza 
(aminoacidi) 


cat Cloramfenicolo 219 Trasposone Tn9 Acetilazione del cloramfenicolo (Gorman, Moffat e 
acetyl-transferasi di E. coli utilizzando !4C acetil-CoA Howard, 1982) 
lacZ B-galattosidasi 1024 E. coli Conversione di ONPG incolore (Norton e Coffin, 
in un prodotto giallo; screening 1985) 


blu-bianco con XGal 


gusA  B-glucuronidasi 603 E. coli Conversione del MUG in un saggio (Jefferson et a/., 1986) 
fluorimetrico; screening 
blu-bianco con XGluc 


luc luciferasi 550 Photinus pyralis Ossidazione della luciferina per la (de Wet et al., 1987) 
(lucciola) produzione di luce 
GFP Proteina fluorescente 238 Aequoria victoria Emette fluorescenza verde (Chalfie et al., 1994) 
verde (medusa) quando viene esposta a luce 
blu o UV 


ONPG —- o-nitropheny1-B-D-galactopyranoside. 

XGal — 5-bromo-4-chloro-3-indoly1-B-D-galactopyranoside. 
MUG - 4-methylumbellifery] B-D-glucuronide 

XGluc — 5-bromo-4-chloro-3-indoly1-B-D-glucuronide. 
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per i quali è possibile selezionare a favore in ceppi di lievito difettivi per quella 
funzione. Per utilizzare un gene reporter, la sequenza di DNA del UAS,, viene clo- 
nata a monte del gene reporter così che la sua espressione dipenda dall’associa- 
zione tra il DBD e VLAD separati. Per esempio, l’espressione del gene /acZ di 
E. coli in cellule eucariotiche, incluso il lievito, produce un enzima B-galattosidasi 
funzionante. La produzione di questo enzima può essere rilevata utilizzando me- 
todi simili a quelli che abbiamo già discusso per l’inattivazione inserzionale nei 
vettori di clonaggio (Capitolo 3), per esempio, dal colore blu di colonie cresciute 
su piastre contenenti XGal. Cellule di lievito, nelle quali UAS, è stata posizionata 
a monte della sequenza codificante /acZ, produrranno la B-galattosidasi in maniera 
dipendente da galattosio mediante l’azione di Gal4 (Yocum er al., 1984). 

Come originariamente descritto, il sistema del two-hybrid fu utilizzato per ri- 
levare, in lievito, interazioni specifiche tra due proteine note, talvolta chiamate 
esca e preda (Fields e Song, 1989). Lo screening fu effettuato in un ceppo di lie- 
vito nel quale erano state eliminate le copie selvatiche dei geni GAL4 e GAL8SO, e 
l'interazione produttiva tra esca e preda veniva misurata utilizzando un reporter 
lacZ che conteneva nel promotore siti di legame per Gal4p. Il sistema fu poi rapi- 
damente adattato allo screening di librerie di cDNA (Chien et al., 1991) e modi- 
ficato per funzionare in cellule di eucarioti superiori (Hu, Kornacker e Hoch- 
schild, 2000). Per lo screening di librerie di cDNA, vengono preparate fusioni tra 
le sequenza codificanti dei cDNA e l'AD. La libreria viene poi trasformata in 
cellule di lievito insieme alla fusione Gal4p DBD-esca. I cloni che contengono 
coppie di proteine che interagiscono possono essere isolati dalla libreria come 
quelli che attivano l’espressione del gene reporter (Fig. 6.10). Lo screening deve 
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Figura 6.10. Risultati di un tipico screening two-hybrid. Un ceppo di lievito contenente un reporter 
UASg-lacZ è stato trasformato con due plasmidi. Uno che esprime una fusione Gal4p DBD-esca e 
l’altro che esprime una libreria di fusioni Gal4p AD-cDNA. | trasformanti sono stati selezionati e tra- 
sferiti su piastre contenenti XGal. Solo una delle proteine codificate dalla libreria (nel cerchio) era in 
grado di interagire con l'esca e di produrre una colonia blu. Le proteine che non interagiscono non 
attivano la trascrizione di /acZ e le colonie restano bianche. 


6.6 SCREENING MEDIANTE TWO-HYBRID (DOPPIO IBRIDO) 225 


essere effettuato con la libreria fusa all’AD, poiché la fusione del cDNA al Gal4p 
DBD origina numerose sequenze che sono in grado di attivare la trascrizione 
quando vengono legate al DNA. Una serie di esperimenti ha dimostrato che circa il 
1% di frammenti casuali del DNA genomico di E.coli funzionano come attivatori 
trascrizionali quando vengono fusi al Gal4p DBD (Ma e Ptashne, 1987c). Questo 
origina un livello inaccettabile di falsi positivi, cioè molte colonie di lievito sa- 
ranno in grado di attivare il gene reporter anche se non contengono proteine che in- 
teragiscono tra loro. 


6.6.1 Problemi e alcune soluzioni, con il two-hybrid 


Lo screening per two-hybrid è una tecnica molto utilizzata per rilevare inte- 
razioni proteina-proteina (Colas e Brent, 1998). La tecnica ha, però, diversi 
problemi. Alcuni di questi, insieme a potenziali soluzioni, sono elencati qui 
sotto. 


* Falsi positivi. Sequenze contenute nella libreria di cDNA possono codificare 
per proteine che legano il DNA e che possono attivare la trascrizione senza bi- 
sogno di interagire con la proteina DBD-esca. Se la fusione contenente la 
preda è casualmente in grado di legare il promotore del gene reporter, riuscirà 
a promuovere la trascrizione del reporter anche se non interagisce con l’esca. 
Questo problema si può superare analizzando nello screening l’espressione di 
due o più geni reporter diversi. Questo approccio è essenziale in uno screening 
per proteine che interagiscono e in Figura 6.11 sono mostrati due metodi per 
farlo. Sono stati costruiti ceppi di lievito che contengono più geni reporter che 
sono diversi tra loro tranne che per 1 siti di legame di Gal4p (James, Halladay 
e Craig, 1996). Le colonie vengono analizzate ulteriormente solo se tutti, e 
non solo alcuni, i reporter sono attivati. Un approccio alternativo è di effet- 
tuare lo screening in un ceppo di lievito che esprime due esche diverse ed una 
singola preda (Xu, Mendelsohn e Brent, 1997). In questo caso, si dovrebbe 
avere l'attivazione di solo un gene reporter, mentre se entrambi i reporter ven- 
gono attivati il clone viene considerato falso positivo (Serebiliskii, Khazak e 
Golemis, 1999). 


e Interazioni deboli. Alcune interazioni proteina-proteina, anche se fisiologica- 
mente rilevanti, sono molto deboli. Interazioni proteina-proteina deboli possono 
non essere sufficientemente forti per reclutare il macchinario trascrizionale al 
promotore, e di conseguenza il gene reporter non verrebbe attivato. È stato sti- 
mato che se l’affinità tra esca e preda è più debole di 10-50 uM, la risposta tra- 
scrizionale non viene attivata (Brent e Filey, 1997). 
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Figura 6.11. Utilizzo di reporter multipli nella stessa cellula per ridurre il numero di falsi positivi in 
uno screening two-hybrid. (a) L'attività di tre reporter diversi, ognuno dotato di siti di legame per 
Gal4p (UASc), viene analizzata simultaneamente. Le interazioni tra esca e preda dovrebbe attivare 
tutti i reporter e non solo alcuni di essi. (b) Screening utilizzando due esche differenti. L'interazione 
specifica tra una delle proteine esca e la preda risulta nell’attivazione di solo uno dei due geni re- 
porter. Questo tipo di screening è particolarmente utile per identificare una preda che interagisce 
specificatamente con solo una delle due esche, quando queste sono strettamente correlate tra loro 
(Serebriiskii, Khazak e Golemis, 1999). 


e La proteina esca non può essere un attivatore trascrizionale. Se l’esca è essa 
stessa un attivatore trascrizionale, allora non può essere utilizzata nel sistema di 
screening descritto sopra per cercare proteine interagenti. Molte proteine, anche 
se normalmente non sono attivatori trascrizionali, possono attivare la trascri- 
zione quando vengono attaccate al DNA. Per analizzare esche che ricadono in 
questa categoria, sono stati sviluppati sistemi di screening alternativi, quali 
quelli basati sulla trascrizione dell’RNA polimerasi II (Marsolier, Prioleau e 
Sentenac, 1997), o il sistema della “split-ubiquitin” (Johnsson e Varshavsky, 
1994). 
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* Proteine di membrana. Il sistema di two-hybrid tradizionale prevede che entrambe 
le proteine esca e preda entrino nel nucleo della cellula eucariotica e lì possano in- 
teragire. Alcune proteine non sono in grado di farlo. Per esempio, una proteina as- 
sociata alla membrana verrà legata alla membrana e quindi non entrerà nel nucleo. 
È stata sviluppata una procedura di screening alternativa, chiamata sistema di re- 
clutamento SOS, nella quale l’analisi delle interazioni proteina-proteina avviene 
sulla membrana plasmatica delle cellule di lievito (Aronheim et al., 1997). 


e Interazioni casuali. Alcune proteine riescono ad interagire nel sistema del two- 
hybrid anche se l’interazione non è fisiologicamente rilevante. Per esempio, 
proteine che normalmente sono localizzate in compartimenti cellulari differenti 
o che sono espresse in stadi di sviluppo diversi possono essere in grado di inte- 
ragire tra loro quando vengono espresse nella stessa cellula, ma normalmente 
non sarebbero mai espresse insieme nel loro stato naturale. È anche possibile 
che l’esca e la preda non interagiscano direttamente tra loro, ma che la loro ap- 
parente associazione sia mediata da un’altra proteina cellulare. Per esempio, la 
proteina Rev codificata da HIV interagisce in un sistema two-hybrid con Riplp, 
una nucleoporina di lievito (Stutz, Neville e Rosbash, 1995), ma questa intera- 
zione è in effetti mediata da un’altra proteina di lievito, CrmIp, che è implicata 
nell’esporto nucleare (Neville et a/., 1997). 


e Le esche devono essere valutate singolarmente. Una singola esca può essere sot- 
toposta a screening utilizzando una libreria di.prede, ma le fusioni DBD-esca 
devono essere prodotte individualmente e ciascuna deve essere trasformata in 
cellule di lievito insieme alla libreria. Se si vogliono analizzare esche multiple, 
questo può richiedere molto tempo. L'analisi delle interazioni per incrocio è 
oggi molto utilizzata per valutare un numero elevato di proteine esca (Finley e 
Brent, 1994). Viene costruito un pannello di diverse esche che viene trasformato 
in un ceppo aploide di uno dei due tipi sessuali (a oppure @) di lievito. Una li- 
breria contenente le prede viene trasformata in un ceppo di lievito di tipo ses- 
suale opposto, ed i due ceppi vengono poi incrociati tra loro. I lieviti diploidi ri- 
sultanti vengono analizzati per l’espressione del gene reporter. Questo metodo 
permette di effettuare rapidamente e in un unico esperimento uno screening con 
esche multiple (Colas e Brent, 1998). 


Il sistema del two-hybrid offre opportunità eccellenti per identificare proteine che inte- 
ragiscono tra loro. I punti deboli descritti sopra indicano che la tecnica non funziona 
per tutte le proteine; comunque, come vedremo nel Capitolo 10, sono state costruite 
mappe di interazioni proteina-proteina a livello di tutto il genoma, utilizzando dati ot- 
tenuti con la procedura del two-hybrid (Uetz et al., 2000). Sono stati descritti diversi 
sistemi di two-hybrid, che utilizzano esche con DBD differenti (es. quelli delle pro- 
teine repressore batteriche LexA o TetR) oppure prede con sequenze AD differenti (es. 
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il dominio di attivazione della proteina del Herpes simplex virus VP16 o la sequenza 
di attivazione artificiale B42); vedere Brent e Finley (1997) per un riassunto. 


6.7 Altri sistemi di screening per interazioni - Variazioni sul tema 


Il sistema del two-hybrid è stato ampiamente modificato per adattarlo ad altri 
scopi. Il principio alla base di tutti i tipi di screening che sono di seguito elencati è 
la ricostituzione di un attivatore trascrizionale sul promotore di un gene reporter 
del quale sia possibile rilevare l’espressione (Fig. 6.12). 
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Figura 6.12. Altri tipi di screening per interazioni. (a) One-hybrid screening. (b), (c) Three-hybrid 
screening. Vedere il testo per i dettagli. 
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6.7.1 One hybrid 


In una semplificazione del sistema del two-hybrid, una libreria di cDNA-AD viene 
introdotta in un ceppo di lievito che ospita un gene reporter nelle cui sequenze a 
monte sono stati introdotti specifici siti di legame. Le proteine codificate dal cDNA 
che sono in grado di legare queste sequenze di legame attiveranno la trascrizione del 
gene reporter (Li e Herskowitz, 1993). Questo approccio è utile per identificare pro- 
teine che regolano promotori di geni noti (Wang e Reed, 1993). Per effettuare uno 
screening di questo tipo, l'elemento di DNA che contiene il sito di legame è gene- 
ralmente multimerizzato per produrre un elemento che fornisca una attivazione forte 
(mediante i legame di molte proteine attivatrici) così che l’espressione del reporter 
possa essere rilevata facilmente. 


6.7.2 Three hybrid 


Qualunque meccanismo attraverso il quale le funzioni DBD e AD dell’attivatore 
trascrizionale possano essere riunite può essere utilizzato per attivare il gene repor- 
ter. Sono stati descritti diversi sistemi di screening nei quali le proteine di fusione 
con il DBD e con AD non interagiscono direttamente tra di loro, ma l'interazione 
è mediata da un altro fattore. Per esempio, SenGupta er al. hanno connesso due 
proteine di legame per l'RNA (una fusa al DBD e l’altra fusa all’AD) mediante 
una molecola di RNA bifunzionale prodotta in cellule di lievito (SenGupta er al., 
1996). È stato possibile sviluppare screening per cercare proteine di legame al 
RNA che legassero nuove sequenze incorporate nel RNA linker. In modo simile, 
Licitra e Liu hanno messo a punto un sistema per rilevare interazioni tra proteine e 
-piccole molecole (Licitra e Liu, 1996). In questo sistema, il DBD è fuso ad una 
proteina che lega un ligando (un recettore che lega l'ormone dexametasone): un li- 
gando bifunzionale (che contiene dexametasone ed altri gruppi) è stato utilizzato 
per cercare proteine, in una libreria di cDNA-AD, che legassero le altre parti del li- 
gando bifunzionale. In entrambi i casi qui descritti, un componente non proteico 
tiene insieme il DBD e L'AD per permettere la trascrizione. 


6.7.3 Reverse two-hybrid 


L'interazione tra esca e preda è utilizzata per indurre la trascrizione di un gene la 
cui espressione è letale per la cellula (Leanna e Hannink, 1996). Questo è utile per 
lo screening di sostanze capaci di rompere l’interazione tra le proteine, permet- 
tendo alle cellule di sopravvivere grazie alla mancata espressione del reporter 
(Huang e Schreiber, 1997). 


—— 


Ti Mutagenesi 


Concetti chiave 


+ Le mutazioni, modificazioni della sequenza di DNA, sono vitali per 
comprendere il funzionamento dei geni e delle proteine 


+ Le sequenze di DNA possono essere modificate in modo diretto e 
altamente specifico 


+ Gli oligonucleotidi che si legano ad una sequenza complementare di 
DNA possono essere utilizzati per creare mutanti con nucleotidi 
sostituiti. Un oligonucleotide mutato può quindi essere utilizzato 
come innesco (primer) per la sintesi di nuovo DNA che contenga 
specifiche mutazioni 


+ | metodi per la selezione dei filamenti di DNA possono distinguere 
tra il DNA mutato di nuova sintesi e il DNA stampo originario 


+ La tecnica della PCR può essere usata per creare mutazioni specifi- 
che e casuali 


La sequenza nucleotidica di un gene determina la sequenza di aminoacidi della pro- 
teina da esso codificata. Di conseguenza, le mutazioni all’interno di un gene, cioè le 
alterazioni della sequenza di DNA, possono determinare cambiamenti nella se- 
quenza di aminoacidi nella proteina corrispondente. Le mutazioni che riducono 0 
modificano l’attività di una proteina, possono essere utilizzate per attribuire partico- 
lari funzioni a specifiche regioni delle proteine. Il tasso fisiologico delle mutazioni, 
risultante da errori casuali nella replicazione del DNA, è piuttosto basso (si stima 
che venga sostituito un nucleotide ogni 10° — 108 nucleotidi replicati) e varia in fun- 
zione dei geni e degli organismi. Tali mutazioni sono state tuttavia utilizzate per l’i- 
solamento di geni e la descrizione di specifiche funzioni delle proteine da essi codi- 
ficate. Prima dell'esplosione delle tecniche di biologia molecolare negli anni ‘70 e 
°80, si poteva ottenere un tasso di mutazioni più elevato trattando le cellule integre 
con agenti mutageni fisici o chimici. Ad esempio, la sostituzione di basi lungo tutto 


232 MUTAGENESI 7 


il genoma, può essere indotta trattando microrganismi o singole cellule eucariotiche 
con raggi X, luce UV o sostanze chimiche come l’etil-metan-sulfonato (EMS). Una 
volta prodotti, questi cambiamenti vengono trasmessi di generazione in generazione 
a seguito delle divisioni cellulari. Una mutagenesi tradizionale di questo tipo pre- 
senta, tuttavia, numerose controindicazioni. Ad esempio, le mutazioni così prodotte 
sono casuali, possono verificarsi dappertutto nel genoma e non sono ristrette a singoli 
geni o a parti di essi. Inoltre, l’identificazione di mutazioni introdotte in geni speci- 
fici richiede tecniche di screening molto laboriose e sofisticate. Queste tecniche sono 
piuttosto semplici da mettere a punto nel caso di geni che codifichino, ad esempio. 
per uno degli enzimi di una via metabolica. Mutazioni che distruggono l’attività di 
un membro di una via metabolica comportano la probabile incapacità dell'organismo 
di metabolizzare un particolare nutriente. Per l'isolamento di questi mutanti possono, 
quindi, essere allestiti degli screening basati su semplici saggi di crescita. Le forme 
tradizionali di mutagenesi hanno un'ulteriore limitazione dovuta al fatto che i cam- 
biamenti fenotipici osservati in uno screening possono essere dovuti alla mutazione 
di più di un gene. Infatti, mutazioni multiple sono talvolta necessarie, soprattutto nei 
casi di ridondanza genica, per produrre un fenotipo osservabile. 

Le mutazioni del DNA generalmente ricadono in due categorie. Nella prima, 
una o più basi del DNA vengono sostituite da altre basi. modificando così la se- 
quenza del DNA. Nella seconda una o più basi sono inserite o rimosse dal gene. 
Singole sostituzioni di basi sono denominate transizioni o transversioni: 


e Le mutazioni nella classe delle transizioni comportano il cambiamento di una 
coppia di basi purina-pirimidina in una differente coppia purina-pirimidina 
(es. AT+ GC,0 GC. AT, TA CG); 

e le mutazioni nella classe delle transversioni comportano il cambiamento di 
una coppia di basi purina-pirimidina in una coppia di basi pirimidina-purina 
(es. AT+ TA, o GC + CG, 0 GC + TA dAT-CG). 

I cambiamenti di singole basi possono produrre varie alterazioni della sequenza 


aminoacidica della proteina codificata dal gene in cui ha avuto luogo il cambia- 
mento della base. La mutazione può essere di tipo: 


* silente — quando una base del codone viene modificata, ma l’aminoacido codifi- 
cato rimane lo stesso (es. le triplette 5°-TCG-3” e 5°-TCC-3° codificano entrambe 
per l’aminoacido serina): 


e missenso — quando la sostituzione di una base nel codone cambia l’aminoacido 
codificato (es. se il codone per la serina 5°-TCG-3' viene mutato in 5°--ACG-37, 
l’aminoacido treonina verrà inserito al posto della serina nel peptide codificato): 

e nonsenso — quando un codone viene modificato in un segnale di stop. Ad esem- 
pio, se il codone per la serina 5°-TCG-3' è mutato in 5°-TAG-3°, la sintesi del 
peptide codificato terminerà in questa posizione. 
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L'inserimento (inserzione) o la rimozione (delezione) di una coppia di basi, o di più 
coppie di basi, nella sequenza codificante di un gene può avere drastiche conse- 
guenze sul peptide codificato. Dato che il codice genetico del DNA è letto a triplette, 
inserzioni o delezioni di basi che non siano multipli di tre produrranno uno scivola- 
mento della fase di lettura (frame-shift). Se, ad esempio, si ha la cancellazione di un 
singolo carattere nella frase seguente, il suo significato viene radicalmente alterato: 


THE FAT CAT ATE THE RAT 


(Il gatto grasso mangiò il ratto) 
Delezione di A 


THE FAI STA TET HER AT. 
(frase senza significato) 


Analogamente, la delezione o l'inserzione, di una o più basi nella sequenza codifi- 
cante di un gene modificherà radicalmente il significato della sequenza al di là 
della stessa mutazione. Solo la delezione o l'inserzione di multipli di tre basi la- 
scerà immutato il significato della sequenza oltre la mutazione, ma comporterà 
l’inserzione o la delezione di uno o più aminoacidi. 


THE FAT CAT ATE THE RAT 


(Il gatto grasso mangiò il ratto) 
Delezione di FAT 


THE CAT ATE THE RAT 


(Il gatto mangiò il ratto) 


Il cambiamento di un singolo aminoacido in un altro all’interno di una proteina può 
avere notevoli conseguenze sulla funzione della stessa proteina. Allo scopo di stu- 
diare in modo diretto la relazione tra geni e proteine è necessario mettere a punto ap- 
procci sperimentali per creare mutazioni nel DNA in maniera altamente specifica. 


7.1 Creazione di cambiamenti specifici nel DNA utilizzando 
la mutagenesi per estensione del primer 


Come abbiamo già visto nel Capitolo 3, il genoma del batteriofago M13 nel corso 
del suo ciclo vitale, subisce una transizione dalla forma a singolo filamento a 
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quella a doppio filamento. La forma a singolo filamento del genoma serve come 
stampo per la sintesi di un nuovo filamento di DNA. Questo processo può essere 
usato a nostro vantaggio se vogliamo creare mutazioni all’interno del filamento di 
DNA di nuova sintesi, come è illustrato in Figura 7.1. L'utilizzo di oligonucleotidi 
per generare mutazioni sito-dirette fu messo a punto nel laboratorio di Michael 
Smith, che nel 1993 ha condiviso il premio Nobel per la Chimica per questa sco- 
perta. Smith e i suoi colleghi utilizzarono il DNA genomico a singolo filamento di 
M13 come stampo per l’ibridazione di un oligonucleotide sintetico (Zoller e 
Smith, 1983). L’oligonucleotide si lega alla sua sequenza complementare nel ge- 
noma a singolo filamento, e viene costruito in modo che una o più mutazioni 
(appaiamenti di basi non-complementari) siano introdotte quando si lega al DNA 
di M13. Il legame al DNA a singolo filamento è stabilizzato dall’appaiamento di 
basi complementari nelle altre posizioni dell’oligonucleotide. Oltre a modificare 
singole basi, un oligonucleotide può anche introdurre inserzioni o delezioni di 
basi all’interno di un gene. Una volta che si è legato alla sua sequenza comple- 
mentare, l’oligonucleotide fornisce un gruppo 3‘-ossidrile libero in grado di inne- 
scare la sintesi del DNA. La molecola ibrida di DNA, parzialmente a doppio fila- 
mento, viene incubata con l’enzima DNA polimerasi in presenza dei quattro 
deossinucleosidi trifosfati (ANTP). Si avrà quindi la sintesi di un nuovo filamento 
di DNA che è perfettamente complementare al filamento originale di DNA 
tranne che nelle posizioni dove erano state inserite le mutazioni nello stesso oli- 
gonucleotide. Il nuovo filamento di DNA circolare viene quindi completato dal- 
l’azione della DNA ligasi, che in presenza di ATP, salda tutte le possibili interru- 
zioni lungo il filamento di DNA. Il DNA nudo non è in grado di infettare le cel- 
lule di E. coli e quindi deve essere introdotto dove il DNA possa essere replicato 
e si possano formare le particelle del fago. Quando le molecole di DNA circolare 
vengono replicate nelle cellule batteriche, può accadere che la progenie di batte- 
riofago M13 abbia origine dal filamento di DNA wild-rype o dal filamento mu- 
tato. Quindi le placche di M13 conterranno la sequenza wi/d-type o quella mu- 
tata. 

I batteriofagi che contengono la sequenza normale o quella mutata possono es- 
sere riconosciuti attraverso un saggio di ibridazione (simile a quello descritto nel 
Capitolo 6). Una versione marcata radioattivamente dell’oligonucleotide sintetico 
utilizzato per creare la mutazione si legherà preferenzialmente alla sequenza mu- 
tante piuttosto che quella normale (Wallace et a/., 1981). Quindi le placche di bat- 
teriofago in grado di legare l’oligonucleotide marcato in condizioni di alta strin- 
genza conterranno le sequenze mutanti. 

La mutagenesi sito-diretta per estensione del primer cominciò ad essere larga- 
mente utilizzata nei primi anni ‘80. Tale procedura presentava, tuttavia, diverse li- 
mitazioni alla produzione rapida di una varietà di mutazioni specifiche nel DNA. 
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Figura 7.1. Mutagenesi sito-diretta che utilizza uno stampo di DNA a singolo filamento. Il DNA a sin- 
golo filamento isolato da un fago M13 ricombinante che contiene il gene da mutare viene isolato e 
utilizzato come stampo per il legame di un primer oligonucleotidico. Il primer si lega alla sua se- 
quenza complementare e introduce una o più mutazioni specifiche. L’ibrido viene quindi trattato con 
DNA polimerasi in presenza dei quattro deossinucleotidi trifosfato (ANTP) per sintetizzare un nuovo 
filamento di DNA di M13 complementare all’originale in tutte le posizioni, eccetto in quelle mutate nel 
primer. Lo scheletro zucchero-fosfato del filamento circolare di DNA di nuova sintesi viene quindi 
completato con la DNA ligasi e il DNA a doppio filamento è trasformato in cellule di E. coli. In E. colii 
nuovi fagi M13 saranno dunque prodotti a partire dal DNA mutato o da quello normale. 
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e Il DNA che deve essere mutato va clonato nel genoma di M13. 


* L'efficienza della procedura di mutagenesi è piuttosto bassa. Per creare un fila- 
mento di DNA mutante è necessario che il legame dell’oligonucleotide, la repli- 
cazione e la ligazione abbiano luogo con elevata efficienza. È probabile che l’ef- 
ficienza di ciascuno di questi passaggi sia inferiore al 100% e, quindi, nella mi- 
scela utilizzata per la trasformazione batterica, le molecole dei filamenti di DNA 
normale saranno molto più numerose di quelle di DNA mutante. 


e Il DNA di nuova sintesi non sarà metilato in quanto viene prodotto in vitro, al 
contrario di quello del genoma di M13 isolato dalle colture batteriche che invece 
è metilato. Questo è importante perché i sistemi di riparazione degli accoppia- 
menti errati (mismatch repair) presenti in £. coli favoriscono la riparazione delle 
basi non metilate (Kramer e Fritz, 1984). Questo implica che nella riparazione 
degli accoppiamenti errati tra il filamento normale e quello mutato verrà favorito 
il ripristino della sequenza normale. 


e I saggi utilizzati per il riconoscimento dei fagi mutanti sono lenti e macchinosi e 
spesso portano all’isolamento di fagi normali piuttosto che mutanti. 


Tutti questi fattori comportano un'efficienza di mutazione piuttosto bassa. Tipica- 
mente, in reazioni di mutagenesi da estensione del primer come quella qui de- 
scritta, l'efficienza è inferiore al 10%. Una conseguenza della bassa frequenza di 
mutazione è che deve essere saggiato un gran numero di potenziali mutanti per es- 
sere certi di isolarne almeno uno (Fig. 7.2). Se disponessimo di procedure in cui la 


i — mM 
(©) (0,1) (©) 


(Ca) 


Numero di cloni analizzati per ottenere 
il 30% di probabilità di isolare un mutante 


(©) 


0 10 20 30 40 50 60 70 80 90 100 
Efficienza della mutagenesi (%) 


Figura 7.2. Procedure efficienti di mutagenesi riducono sensibilmente il numero di cloni che deve 
essere saggiato per isolare un singolo mutante specifico. 
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frequenza di mutazione fosse vicina al 100% avremmo la certezza di isolare un 
mutante mediante lo screening di una singola placca di batteriofago (o al massimo 
due). Frequenze di mutazione più basse richiederebbero lo screening di un numero 
maggiore di placche per isolare un mutante, e questo comporterebbe tempi sensi- 
bilmente più elevati per l'isolamento di mutazioni specifiche. I metodi che sono 
stati sviluppati per migliorare l’efficienza complessiva della mutagenesi cercano di 
ottimizzare l’efficienza della stessa reazione di mutagenesi o utilizzano ceppi bat- 
terici che mostrano una minore propensione a degradare i filamenti neoformati di 
DNA mutante. Ad esempio, cellule di E. coli che sono difettive nel sistema di ripa- 
razione degli appaiamenti errati (mutL, mutS, mutH) possono essere usate per la 
trasformazione di molecole ibride di DNA, in modo che la mutazione non sia suc- 
cessivamente riparata per ripristinare la sequenza normale. 


7.2 Metodi di selezione dei filamenti 


Un approccio molto efficace per migliorare l'efficienza della mutagenesi consiste 
nella messa a punto di procedure in grado di selezionare il filamento mutante di 
DNA, o di controselezionare il filamento normale. Qui saranno descritti due me- 
todi del secondo tipo che sono tuttora in uso. Nel primo l’incorporazione di analo- 
ghi dei nucleotidi protegge il filamento neoformato di DNA dalla degradazione in 
vitro (Taylor, Ott e Eckstein, 1985), mentre nel secondo tipo il filamento normale 
di DNA viene indirizzato alla degradazione in cellule di E. coli (Kunkel, 1985). 


7.2.1 Selezione di un filamento fosforotioato 


Un nucleotide fosforotioato contiene un legame fosforo-zolfo al posto del legame 
fosforo-ossigeno (Fig. 7.3). Se un deossinucleotide fosforotioato in cui lo zolfo è 
legato ad un a-fosfato viene utilizzato nella reazione di sintesi del DNA, il fosforo- 
tioato sarà incorporato nel filamento neoformato di DNA. Alcuni enzimi di restri- 
zione sono incapaci di tagliare il DNA che contiene fosforotioati (Nakamaye & 
Eckstein, 1986). L’oligonucleotide mutageno si lega allo stampo di DNA di M13 
come precedentemente descritto, ma viene esteso dalla DNA polimerasi in pre- 
senza di tre deossinucleotidi trifosfato (AATP, dTTP e dGTP) e di un singolo nu- 
cleotide fosforotioato (ACTPaS). Si avrà quindi la formazione di un filamento di 
DNA di nuova sintesi che conterrà il nucleotide fosforotioato in corrispondenza di 
ogni residuo di C, che invece non sarà presente nel filamento wi/d-type. La rottura 
del DNA a doppio filamento, ad esempio con l’enzima di restrizione PstI, produrrà 
l’incisione del filamento normale (privo di fosforotioato) ma non di quello mu- 
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Figura 7.3. Il DNA contenente il gruppo fosforotioato è resistente alla rottura mediata da alcuni 
enzimi di restrizione. (a) La struttura chimica di ACTPaS. Uno zolfo sostituisce l'ossigeno sul fosfato 
a del nucleotide (in rosso). (b) L'effetto dei nucleosidi fosforotioato sulla rottura del DNA mediata 
dall’enzima Pstl. Pstl taglia la sequenza mostrata per generare estremità complementari di quattro 
nucleotidi. Se la sequenza contiene un fosforotioato (indicato dall'asterisco) in corrispondenza dei re- 
sidui di C presenti su un filamento della sequenza target, l'enzima produrrà un’incisione solo sull’al- 
tro filamento. Se ambedue i filamenti contengono fosforotioato l'enzima non opererà alcun taglio nei 
due filamenti. 


tante. Il filamento con l’incisione può essere rimosso mediante trattamento con 
esonucleasi III, un enzima che degrada il DNA a partire dalle estremità. L’esonu- 
cleasi non degraderà i DNA circolari mutanti in quanto essi non contengono estre- 
mità libere. Il DNA risultante, utilizzato per la trasformazione. in E. coli, risulterà 
arricchito di DNA circolari mutanti L'efficienza di mutazione con questo metodo 
può arrivare al 40-60%. 


7.2.2 Selezione di filamenti dut” ung” (o Kunkel) 


In questo metodo, il filamento wi/d-type non mutato è indirizzato verso la degrada- 
zione. Lo stampo di DNA per la reazione di mutagenesi è ottenuto dalla crescita 
del fago in cellule di E. coli che contengono mutazioni in entrambi i geni dut e ung 
(Fig. 7.4). 
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Figura 7.4. Il metodo dut” ung” di selezione dei filamenti (Kunkel, 1985) per degradare le sequenze 
non mutanti nella mutagenesi sito-diretta. Ulteriori dettagli nel testo. 


* Il gene dut codifica per una UTPasi la cui funzione è degradare il AUTP all’in- 
terno della cellula. La mutazione di dut comporta un’elevata concentrazione di 
dUTP (U) che si accumula nella cellula e viene incorporato al posto della timina 
(T) in alcune posizioni durante la replicazione del DNA. 


* Il gene ung codifica una uracil-N-glicosilasi che normalmente rimuove l’uracile 
dal DNA. 
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Quindi, in un doppio mutante (du, ung”), l’uracile viene incorporato nel DNA e 
questo errore non viene riparato. I residui di U hanno le medesime proprietà di ap- 
paiamento dei residui di T, pertanto l’incorporazione di U al posto di T nel DNA 
non è di per sé mutagena. Il DNA del fago M13 isolato da ceppi di E. coli dut” 
ung” conterrà approssimativamente 20-30 residui di U ogni circa 8.000 basi nel ge- 
noma. Il DNA a singolo filamento isolato da M13 viene usato come stampo per 
l’appaiamento dell’oligonucleotide mutageno. La reazione di estensione viene con- 
dotta come descritto precedentemente per produrre un filamento di DNA mutante 
di nuova sintesi che non contiene residui di uracile. Di nuovo, dopo il completa- 
mento della sintesi del secondo filamento di DNA, le estremità vengono saldate co- 
valentemente mediante la DNA ligasi. Il DNA risultante a doppio filamento è co- 
stituito dal filamento wi/d-type contenente residui di uracile, e dal filamento neo- 
sintetizzato che contiene le basi mutanti presenti nell’oligonucleotide, ma non i re- 
sidui di uracile. Il DNA a doppio filamento viene quindi trasformato in cellule di 
E. coli ung*, dove la uracil-N-glicosilasi riconosce i residui di uracile nel DNA e li 
rimuove lasciando siti apirimidinici nel filamento stampo. La presenza di siti apiri- 
midinici rende il filamento di DNA biologicamente inattivo dato che non può es- 
sere replicato dalla DNA polimerasi. Il DNA viene tagliato in corrispondenza dei 
siti apirimidinici da una specifica endonucleasi (endonucleasi IV) presente nelle 
cellule di E. coli e quindi degradato. Quindi, quando il DNA a doppio filamento 
viene introdotto in E. coli ung*, solo il filamento mutante sarà replicato. Con que- 
sto tipo di approccio si può ottenere una efficienza di mutazione vicina al 100%. 

Sebbene si possa ottenere un'elevata efficienza di mutazione del DNA utiliz- 
zando i metodi precedentemente descritti, tutte queste tecniche sono basate sul- 
l’iniziale clonaggio in M13 del gene che deve essere mutato in modo da isolare 
DNA a singolo filamento. L'utilizzo diffuso di vettori costituiti da plasmidi di 
DNA a doppio filamento rende il clonaggio di frammenti di DNA nel vettore di 
mutagenesi M13, e il successivo riclonaggio del DNA mutato nel plasmide origi- 
nale, una procedura piuttosto lunga e laboriosa. 


7.3 Mutagenesi a cassetta 


La “mutagenesi a cassetta” richiede che il DNA che deve essere mutato sia fian- 
cheggiato da due siti di restrizione (Fig. 7.5). Il plasmide viene digerito con gli en- 
zimi e il grande frammento di DNA corrispondente alla maggior parte del plasmide 
viene purificato dal frammento più piccolo. Il DNA plasmidico lineare viene 
quindi legato ad un DNA sintetico a doppio filamento generato dall’appaiamento 
di due oligonucleotidi complementari (Fig. 7.5). Gli oligonucleotidi complementari 
contengono la mutazione desiderata e le sequenze sporgenti necessarie per la liga- 
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Figura 7.5. Mutagenesi a cassetta. Il DNA fiancheggiato da sue siti di restrizione è rimosso dal DNA 
plasmidico e sostituito da una cassetta oligonucletidica a doppio filamento che contiene le mutazioni 
desiderate. In questo esempio un codone per l’alanina (A) nella regione codificante per la proteina 
tra i siti di restrizione per EcoRI e Pstl viene modificato in un codone per la lisina (K). Gli oligonucleo- 
tidi a singolo filamento vengono sintetizzati in modo che, a seguito dell’ibridazione, formino le estre- 
mità coesive richieste per la ligazione al DNA plasmidico precedentemente digerito. 


zione ai siti di restrizione (Wells, Vasser e Powers, 1985). Questa procedura intro- 
duce mutazioni con elevata efficienza, purché il piccolo frammento wi/d-type di 
DNA sia stato rimosso. La principale limitazione di questa tecnica è la necessità di 
avere due siti di restrizione fiancheggianti il DNA che deve essere mutato (Worral, 
1994). Inoltre, gli oligonucleotidi di lunghezza superiore a 70 sono difficili da sin- 
tetizzare in modo accurato. Sebbene tale dimensione non costituisca un limite alla 
distanza tra i siti di restrizione, in quanto possono essere prodotti più oligonucleo- 
tidi sovrapposti per generare una sequenza più lunga, essa tuttavia pone un limite 
alla dimensione di una cassetta che possa essere prodotta in modo efficiente. Tor- 
neremo di nuovo sulla “mutagenesi a cassetta” quando affronteremo il problema 
della produzione di mutazioni casuali in geni specifici. 


7.4 Mutagenesi tramite PCR 


Abbiamo già visto come specifiche mutazioni possano essere introdotte all’estre- 
mità di prodotti di PCR mediante l’utilizzo di primer appropriati in modo che l’effi- 
cienza di mutazione sia vicina al 100% (Capitolo 4). Questo metodo (vedi Fig. 4.7), 
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per cui le mutazioni vengono introdotte negli stessi primer utilizzati per la PCR, è 
eccezionalmente efficace per introdurre alterazioni alle estremità di frammenti li- 
neari di DNA, ma è limitato a queste estremità. Tuttavia, sono stati sviluppati pro- 
tocolli per PCR che rendono possibile la creazione di mutazioni in qualunque posi- 
zione all’interno del prodotto di PCR (Higuchi, Kummel e Saiki, 1988). Questo 
metodo, spesso denominato mutagenesi tramite PCR in due fasi, richiede quattro 
primer oligonucleotidici e tre diverse reazioni di PCR come descritto in Figura 7.6. 
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Figura 7.6. PCR in due fasi per introdurre mutazioni all’interno di un frammento amplificato di DNA. 
Vengono disegnati primer sovrapposti (primer 2 e primer 3) per introdurre una mutazione nei fila- 
menti senso e antisenso di nuova sintesi. Questi primer sono utilizzati in esperimenti distinti di PCR 
per amplificare in due sezioni il filamento richiesto di DNA — il DNA contenente la mutazione e la 
sequenza al 5° del filamento senso e, separatamènte, il DNA contenente la mutazione e la sequenza 
al 3’ del filamento antisenso. | due prodotti di PCR formati in questo processo si appaiano tra loro 
attraverso le sequenze complementari, in funzione della posizione dei primer. | diversi filamenti di DNA 
possono quindi essere amplificati attraverso i primer 1 e 4 per generare il frammento intatto di 
DNA contenente la mutazione. 
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Due dei primer (1 e 4) sono disegnati in modo da risultare complementari, rispet- 
tivamente, al filamento antisenso e al filamento senso del DNA bersaglio. Gli altri 
due primer (2 e 3) sono disegnati per legarsi a filamenti complementari della 
stessa sequenza di DNA e introdurre la mutazione desiderata in ciascuno di essi. 
Nella prima PCR l’estremità 5°- del gene viene amplificata utilizzando i primer 1 
e 2. Il prodotto risultante porterà la mutazione all’estremità 3*-. Nella seconda 
PCR l’estremità 3’- del gene viene amplificata utilizzando i primer 3 e 4 in modo 
che il prodotto risultante contenga la mutazione alla sua estremità 5°-. I primer 2 e 
3 sono progettati in modo da essere complementari e sovrapponibili tra loro. Que- 
sto significa che l’estremità 3’- del primo prodotto di PCR sarà identica all’estre- 
mità 5°- del secondo prodotto di PCR. Quindi, mescolando tra loro i prodotti di 
PCR della prima e seconda reazione, ed effettuando prima una denaturazione e poi 
una rinaturazione, si avrà che i filamenti individuali prodotti dalla prima e seconda 
reazione di PCR potranno ibridare tra loro. Si formeranno due tipi di molecole 
ibride. Se il filamento senso della PCR n.2 si appaia al filamento antisenso della 
PCR n. 1 si formerà una molecola che non potrà essere estesa dalla DNA polime- 
rasi (le estremità 3’ non sono appaiate). Tuttavia, se il filamento senso della PCR n. 
1 si lega al filamento antisenso della PCR n. 2, allora la DNA polimerasi può pro- 
durre una versione a doppio filamento del gene che contiene la mutazione. In pra- 
tica, i prodotti delle PCR n. 1 e n. 2 vengono mescolati in presenza dei primer 1 e 
4 in modo che l’intero gene mutante sia amplificato per produrre grandi quantità di 
DNA mutante. Come mostrato in Figura 7.6, i primer 1 e 4 non introducono muta- 
zioni nel gene. Tuttavia, spesso accade che questi primer siano utilizzati per intro- 
durre siti di restrizione nel prodotto di PCR (come illustrato in Fig. 4.7) per facili- 
tare il clonaggio del gene mutante in un plasmide. 


e L'efficienza della mutagenesi tramite PCR è molto alta. Le fasi di amplificazione 
assicurano che la quantità di DNA wild-type sia trascurabile nel prodotto finale. 
Tuttavia, anche questo metodo presenta diverse limitazioni. 


* Alcune DNA polimerasi termostabili sono poco accurate e quindi possono intro- 
durre mutazioni indesiderate nel prodotto mutante. È dunque essenziale che l’in- 
tero prodotto di PCR venga sequenziato (vedi Capitolo 9) per assicurare che solo 
la mutazione corretta sia stata introdotta. 


e Frammenti di DNA di grosse dimensioni sono difficili da amplificare tramite 
PCR. Questo può limitare le dimensioni del prodotto finale dell’amplificazione 
che possa essere prodotto in modo efficiente. 


La capacità di introdurre qualunque tipo di mutazione nel DNA ha reso possibile 
molte analisi genetiche precise ed eccezionalmente eleganti, che non sarebbe stato 
possibile fare altrimenti. Inoltre, la suddivisione della reazione di mutagenesi in 
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due componenti separate implica che tali tecniche possano essere facilmente adat- 
tate per la creazione di sequenze di DNA chimerico. Vi sono diverse motivazioni 
alla necessità di congiungere tra loro particolari sequenze di DNA. 


* Analisi di delezione: la rimozione di certe sequenze geniche può essere ottenuta 
dalla fusione delle loro sequenze fiancheggianti. 


e Alterazione del promotore per modificare l’espressione di un gene, come si vedrà 
nel Capitolo 8, molti geni sono espressi in cellule ospite eterologhe per ottimiz- 
zare la produzione di proteine. Per fare in modo che un gene eterologo sia 
espresso è strettamente necessario che esso sia posto sotto il controllo di un pro- 
motore della cellula ospite. 


Costruzione di nuovi geni — nuove proteine possono essere prodotte dalla fusione 
di sequenze di DNA che codificano porzioni di geni differenti; es. le proteine 
possono essere etichettate con determinate sequenze per facilitarne la purifica- 
zione, o per indirizzarle a specifici compartimenti cellulari mediante l'aggiunta 
di sequenze segnale. 


—_ 


metodi tradizionali di clonaggio per fondere le sequenze tra loro si basano sulla 
presenza di siti di restrizione che consentono l’inserzione di DNA estraneo. Que- 
sto limita i tipi di fusione che possono essere prodotti e il livello di precisione con 
cui una particolare fusione può essere realizzata. L'applicazione di un approccio 
che si avvale della PCR può tuttavia contribuire in modo significativo ad elimi- 
nare i problemi prima menzionati. Il disegno di primer appropriati, come illustrato 
in Figura 7.6, porterà alla fusione precisa di qualunque coppia di sequenze se le 
estremità dei primer contengono sequenze sovrapponibili. Infatti, i primer (2 e 3 in 
Fig. 7.6) sono disegnati in modo tale da sovrapporsi tra loro e da contenere la giun- 
zione di fusione finale all’interno della loro sequenza. Pertanto, la giunzione dei 
due prodotti iniziali della PCR porterà alla formazione di una fusione precisa gui- 
data dalla sequenza dei primer della prima reazione. 

Un esempio specifico, derivato dal mio lavoro (Reece e Ptashne, 1993) in cui 
una PCR a due fasi è stata utilizzata con ottimi risultati per creare fusioni geniche, 
è mostrato in Figura 7.7. Il lievito Saccharomyces cerevisiae contiene una grande 
famiglia genica per fattori di trascrizione denominati proteine zine cluster C,. 
Come la maggior parte dei fattori di trascrizione eucariotici, queste proteine hanno 
un dominio di legame al DNA, che media il legame della proteina ai promotori di 
determinati geni, ed un dominio di attivazione, la cui funzione è reclutare la RNA 
polimerasi II. Il dominio di legame al DNA di tre di queste proteine, Gal4p, Put3p 
e Pprlp, è localizzato all'estremità amino-terminale, e contiene sei residui di ci- 
steina altamente conservati che, chelando due ioni zinco, formano il dominio fun- 
zionale di legame al DNA (DBD). Ciascuna proteina si lega al proprio sito di le- 
game sul DNA nella forma di omodimero. Anche i siti di legame al DNA di queste 
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Figura 7.7. Il dominio di legame al DNA di tre proteine zinc cluster C; di lievito. (a) Le sequenze 
aminoacidiche dei domini di legame al DNA di Gal4p, Put3p e Pprip. (b) | siti di legame al DNA di 
queste tre proteine sono tra loro correlati in quanto contengono triplette palindrome e conservate 
5'-CGG-3' separate da un numero di paia di basi variabile per ciascuna proteina. (c) Proteine di 
fusione prodotte da geni chimerici creati a partire da GAL4, PUT3 e PPRI. La sequenza di ogni 
proteina è mostrata a partire dai due residui che precedono l’ultimo residuo di cisteina dello zinc 
cluster C;. 


tre proteine sono tra loro correlati (Fig. 7.7(b)). Cioè, ciascun sito contiene triplette 
di nucleotidi 5°-CGG-3°, invertite e altamente conservate, separate da una sequenza 
spaziatrice variabile. Nel sito di legame per Gal4p, le triplette CGG sono separate 
da 11 pb, mentre 10 pb e 6 pb separano, rispettivamente, queste triplette nei siti di 
legame per Put3p e Pprlp. Dato che ciascuna di queste proteine, tra loro correlate, è 
in grado di legare 1 rispettivi siti di legame sul DNA, differenti ma a loro volta tra 
loro correlati, ci si può domandare quale sia la regione di ciascuna proteina respon- 
sabile della specificità del legame al DNA. Per rispondere a questa domanda si può 
provare a modificare la specificità di legame di una delle proteine zinc cluster C, 
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sostituendo alcuni tratti della sua sequenza aminoacidica con le corrispondenti se- 
quenze di una diversa proteina zinc cluster C;. In assenza di informazioni struttu- 
rali non possiamo sapere quali giunzioni di fusione siano in grado di produrre una 
proteina funzionale. Per questa ragione sono state create numerose proteine di fu- 
sione tra le sequenze di DNA codificanti per proteine zinc cluster C, (Fig. 7.7 (c)). 
Ogni fusione è stata creata attraverso la PCR in due fasi. Il posizionamento delle 
giunzioni di fusione è determinato esclusivamente dalla sequenza degli oligonu- 
cleotidi utilizzati (primer 2 e 3 nella Fig. 7.6). Questa strategia consente di co- 
struire geni chimerici in grado di produrre, come richiesto, proteine in cui le giun- 
zioni di fusione possono essere posizionate aminoacido per aminoacido. Non è ri- 
chiesto alcun sito di restrizione per il clonaggio, dato che gli stessi oligonucleotidi 
utilizzati forniscono la regione di sovrapposizione per la fusione dei geni. Ciascun 
gene chimerico viene quindi clonato in un vettore di espressione di E. coli e la pro- 
teina prodotta viene successivamente purificata e saggiata per la sua capacità di le- 
garsi a ciascuno dei siti di legame sul DNA. 

Ciascuna delle proteine DBD wild-type si lega al DNA con una particolare spe- 
cificità. Put3p e Pprlp si legano esclusivamente ai loro specifici siti bersaglio, 
mentre Gal4p si lega con elevata efficienza al proprio sito, e con efficienza circa 
dieci volte inferiore al sito di legame per Put3p. L'analisi dei geni chimerici ha mo- 
strato che la sostituzione di una regione “zinc-cluster” (Fig. 7.7 (a)) di una proteina 
con quella di un’altra proteina non ha alcun effetto sulla specificità del legame al 
DNA. Ad esempio, la proteina 4 in Figura 7.8 ha la regione “zine cluster” di Put3p 
fusa alla regione carbossi-terminale di Gal4p. Questa proteina si lega al DNA con 
la specificità tipica di Gal4p piuttosto che con quella di Put3p. Si può notare un ri- 
sultato simile anche per le proteine 2 e 7. Ci si è quindi chiesto quale porzione car- 
bossi-terminale fiancheggiante il “zinc cluster” fosse richiesta per invertire la spe- 
cificità rispetto a quella della proteina “zinc cluster” nativa. La maggior parte delle 
proteine di fusione prodotte (Fig. 7.7 (c)) non era in grado di legare alcuna se- 
quenza di DNA, probabilmente perché assumeva una struttura mal ripiegata o non 
allineata correttamente. Tuttavia, le proteine contenenti lo “zinc cluster”, e ulteriori 
19 aminoacidi all’estremità carbossi-terminale, legavano il DNA con la specificità 
tipica della proteina da cui questi residui provenivano (Fig. 7.8). Pertanto, i 19 ami- 
noacidi all’estremità carbossi-terminale dello “zinc cluster” determinano la specifi- 
cità di legame al DNA. Successivamente a questo studio, le strutture dei complessi 
Gal4p-, Put3p- e Prplp- DNA sono state risolte mediante cristallografia ai Raggi 
X (Marmorstein et al., 1992; Marmorstein e Harrison, 1994; Swaminathan et al., 
1997) e sono mostrate nelle Figure 7.8 (c)-(e). Tutti i complessi DNA — proteina 
mostrano la stessa organizzazione. Ogni proteina è in forma dimerica e forma spe- 
cifici contatti con il DNA con la sequenza 5°-CGG-3” mediante lo “zinc-cluster”. 
Lo “zinc cluster” forma un sotto-dominio compatto in cui i due ioni zinco (sfere 
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(8) Sito di legame per Gal4 | Sito di legame per Put3 | Sito di legame per Ppr1 
+ 


| «= Po = | I Complessi 
| | Cono usi DNA-proteine 
I | 
“ < ‘èéîte ut # Seite | tt |< DNA libero 
-123456789/-1234567891-123456789 
(b) Zinc Specificità 
cluster Linker Dimerizzazione Proteina di legame 
1 Gal4p(1-100) GAL4 
Put8p(61- 126) 
3 Gal4p(1-61)+ GALA 
Put3p(84- 126) 
4 Put3p(31-60)+ GAL4 
Gal4p(39-100) 
Gal4p(58-100) 
6 Put3p(31-126) PUT3 
7 Ppr1p(29-63)+ GALA 
Gal4p(41-100) 
8 Pprip(29-80)+ PPRI 
Gal4p(58-100) 
9 Pprip(29-123) PPRI 


Complesso Gal4-DNA Complesso Put3-DNA Complesso Ppr1-DNA 


Figura 7.8. Attività di legame al DNA delle proteine chimeriche di Gal4p, Put3p e Pprip. (a) | siti di 
legame al DNA di ciascuna delle proteine, marcati radioattivamente, sono incubati con le proteine 
purificate prima di sottoporli ad elettroforesi su gel non-denaturante. Il legame della proteina al DNA 
ne ritarda la sua mobilità attraverso il gel osservabile con una ridotta migrazione attraverso il gel. 
(b) Attività di legame al DNA di ciascuna delle proteine chimeriche funzionali. (c)-(e) La struttura, de- 
terminata mediante cristallografia ai Raggi X, dei complessi Gal4p-DNA, Put3p-DNA e Pprip-DNA 
(Marmorstein et al., 1992; Marmorstein e Harrison, 1994; Swaminathan et al, 1997). In ciascun 
esempio il DNA è rappresentato dai bastoncini rossi, e la proteina da un modello a nastri (a-eliche in 
porpora, foglietti-B in blu, e altre catene polipeptidiche in bianco). In ciascun modello gli atomi di 
zinco sono rappresentati da sfere di colore giallo. 
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gialle) sono legati. Allontanandosi dal DNA si estende un motivo di dimerizza- 
zione coiled-coil. Una regione linker tiene insieme lo “zine cluster” al motivo coi- 
led-coil. Questo linker, di lunghezza pari a 19 aminoacidi, forma differenti strutture 
in ciascuna proteina che posiziona differentemente lo “zinc cluster” rispetto al mo- 
tivo coiled-coil. Queste differenze sono sufficienti per determinare la specificità del 
legame alle triplette 5°-CGG-3” separate da un differente numero di paia di basi. 
Un’analisi genica così precisa non sarebbe stata possibile con le tradizionali tecni- 
che di clonaggio. 

La capacità e rapidità delle tecniche di PCR nella produzione di molecole mu- 
tate di DNA, sia nella forma di fusioni geniche, come descritto in precedenza, che 
mediante l’introduzione di mutazioni puntiformi, è fuori discussione. La mutagenesi 
può essere realizzata molto rapidamente. La disponibilità di oligonucleotidi appro- 
priati rende possibile l'esecuzione della strategia della PCR in due fasi in 3-4 h. Il 
fattore limitante del processo è il clonaggio in plasmidi dei prodotti lineari della 
PCR in modo da poter condurre i saggi funzionali. Sono pertanto desiderabili pro- 
cedure che consentano la mutazione di DNA a doppio filamento senza la necessità 
di ulteriori fasi di clonaggio. 


7.5 Mutagenesi QuikChange® 


Le procedure di mutagenesi basate sulla PCR descritte in precedenza richiedono 
che i frammenti lineari del DNA mutato vengano clonati in plasmidi in modo che 
possano essere propagati e sottoposti ad analisi funzionale. Un metodo che utilizzi 
le potenzialità della PCR per introdurre le mutazioni direttamente nel DNA plasmi- 
dico renderebbe superflue tutte le addizionali fasi di clonaggio. 

Uno dei metodi più diffusi per introdurre mutazioni direttamente nel DNA pla- 
smidico e basato su PCR è schematizzato in Figura 7.9. Questo metodo, spesso de- 
nominato QuikChange® (Wang e Malcom, 1999), utilizza due primer oligonucleo- 
tidici. Uno dei primer è prodotto in modo da risultare complementare al filamento 
senso del gene e contiene la mutazione desiderata, mentre l’altro primer, anch'esso 
contenente la mutazione, è disegnato in modo da risultare complementare al fila- 
mento antisenso del gene. Il DNA plasmidico a doppio filamento è utilizzato come 
stampo per la reazione di PCR. L'azione della temperatura, nel corso di una nor- 
male reazione di PCR, separa e denatura i due filamenti di DNA plasmidico. Il raf- 
freddamento del DNA denaturato in presenza degli oligonucleotidi produce il loro 
legame alle corrispondenti sequenze complementari all’interno del plasmide. I suc- 
cessivi cicli termici estendono gli oligonucleotidi per creare il DNA plasmidico 
mutante di nuova sintesi. Dopo il completamento della reazione di PCR, il DNA di 
nuova sintesi (contenente la mutazione) è costituito da due filamenti complemen- 
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Cicli termici successivi producono la denaturazione 
di filamenti di DNA parentali ed estendono 
i primer oligonucleotidi mutanti mediante 
una DNA ie termostabile 


Digestione con 
l'enzima 
Lo restrizione 13 


RSA 


(( \ 
V_/ 


L Trasformazione in E. coli 


Figura 7.9. Mutagenesi QuikChange®. Il plasmide da mutare viene miscelato con due primer oligo- 
nucleotidici sovrapposti e complementari, ciascuno dei quali contiene la mutazione desiderata. | 
primer vengono successivamente estesi da una reazione di PCR che sintetizza entrambi i filamenti 
del DNA plasmidico, contenenti entrambi la mutazione. Il DNA viene quindi digerito con l'enzima 
Dpnl attivo solo su DNA metilato. Se il DNA plasmidico è stato isolato da un ceppo di £. coli Dam*, 
solo questo ma non il DNA di nuova sintesi non metilato verrà digerito dall'enzima. La successiva tra- 
sformazione in E. coli produrrà la degradazione dei frammenti digeriti di DNA parentale e la ripara- 
zione delle interruzioni nel DNA di nuova sintesi. Il DNA mutato di nuova sintesi potrà quindi essere 
replicato. 
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tari di DNA lineare in grado di formare DNA circolare a doppio filamento conte- 
nente interruzioni sfalsate (Fig. 7.9). I prodotti di PCR vengono quindi digeriti con 
l’enzima di restrizione Dpnl, specifico per il DNA metilato: 


Dpnl: 
CH, 
5°-GA|TC-3" 
3°-CT ali 


CH, 


Il DNA di nuova sintesi non sarà metilato e di conseguenza non verrà digerito dal- 
l'enzima di restrizione. Se, d'altra parte, il DNA plasmidico parentale, è stato iso- 
lato da un ceppo di £. coli che contiene la metilasi Dam (vedi Capitolo 2), l’en- 
zima DpnlI digerirà la sua sequenza di riconoscimento. La maggior parte dei ceppi 
di E. coli utilizzati in laboratorio sono dam*, e quindi questo metodo di degrada- 
zione del DNA wild-type è applicabile alla maggior parte dei plasmidi impiegati in 
laboratorio. La trasformazione dei prodotti dell'enzima di restrizione in cellule di 
E. coli produrrà la degradazione dei frammenti di DNA wild-type e la riparazione 
delle interruzioni nelle molecole circolari del DNA di nuova sintesi, che quindi sa- 
ranno selettivamente propagate. Questa procedura è molto rapida (3-4 h) ed effi- 
ciente (-80%) nella produzione di plasmidi di DNA mutato senza la necessità di 
ulteriori fasi di clonaggio. 


7.6 Creazione di mutazioni casuali in geni specifici 


La creazione di specifici mutanti di geni utilizzando primer oligonucleotidici ha ri- 
voluzionato la nostra comprensione della funzione delle proteine. Gli esempi di- 
scussi finora, tuttavia, sono stati limitati alla sostituzione di specifiche basi di un 
gene con altre basi. In tal modo si ottiene la formazione di proteine mutate caratte- 
rizzate da specifiche sostituzioni aminoacidiche nel caso in cui le alterazioni nu- 
cleotidiche abbiano modificato la porzione codificante del gene. Non è sempre 
possibile sapere quale aminoacido di una proteina dovrebbe essere alterato, e in 
che modo. Alcuni approcci sistematici a questo problema hanno considerato l’alte- 
razione sistematica di tutti i codoni attraverso mutazioni che introducessero una so- 
stituzione dell’aminoacido codificato in alanina (Cunningham e Wells, 1989). Que- 
sta mutagenesi per scansione di alanina può identificare catene laterali aminoaci- 
diche importanti per la funzione della proteina nell’ipotesi che la presenza di ala- 


a 
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nina non introduca perturbazioni significative nella struttura complessiva della pro- 
teina e comporti solo l'eliminazione di specifiche interazioni intra-proteiche. Que- 
sto tipo di approccio, che richiede la disponibilità di un saggio per il riconosci- 
mento della funzione proteica, è applicabile specialmente a piccole proteine o do- 
mini proteici a causa del gran numero di mutanti individuali che sarebbe necessario 
costruire. Un approccio alternativo prevede la sostituzione di una serie di aminoa- 
cidi carichi consecutivi all’interno di un peptide lineare in residui di alanina (Bass, 
Mulkerrin e Wells, 1991). Questa mutagenesi per scansione da residui carichi 
ad alanina è basata sull’osservazione che la maggior parte delle proteine contiene 
un nucleo idrofobico con i residui carichi esposti sulla superficie esterna della pro- 
teina. Di conseguenza gruppi di residui carichi in una sequenza proteica lineare sa- 
ranno normalmente localizzati sulla superficie della proteina e saranno, ad esem- 
pio, coinvolti in interazioni proteina-proteina. Le mutazioni che alterano questi 
gruppi di residui carichi elimineranno le interazioni proteina-proteina con mag- 
giore probabilità rispetto a mutazioni di altri residui. 


Due diversi approcci vengono normalmente impiegati per la creazione di muta- 
zioni casuali all’interno di specifici geni, o parti di geni. Di nuovo, questi metodi si 
basano su saggi per l’identificazione di mutanti con fenotipi appropriati, ma non 
pongono limitazioni rispetto al tipo di alterazioni che possono essere introdotte. 


* Mutagenesi a cassetta degenerata. Si può realizzare un esperimento simile a 
quello già illustrato in Figura 7.5, ma legando nel plasmide digerito una libreria 
di oligonucleotidi (Fig. 7.10). Come nella mutagenesi a cassetta convenzionale, 
si rimuove dal plasmide il DNA tra due siti di restrizione sostituendolo con una 
coppia di oligonucleotidi sintetici. In questo caso, tuttavia, questi non corrispon- 
dono ad un’unica sequenza, ma derivano da librerie di oligonucleotidi contenenti 
mutazioni casuali rispetto ad una stessa sequenza di base. Questi oligonucleotidi 
degenerati (doped) vengono sintetizzati impiegando una miscela di basi (Fig. 4.6). 
Ad esempio, nel caso in cui debba essere aggiunta una A ad un oligonucleotide 
in estensione, si può aggiungere una miscela contenente A e piccole quantità de- 
gli altri nucleotidi invece che esclusivamente il precursore per A. Tali miscele 
normalmente contengono il 95% del nucleotide wild-type e 1° 1,7% di ciascuno 
degli altri nucleotidi. Il livello di “degenerazione” controlla di fatto il livello di 
mutagenesi che verrà realizzato. Nell'esempio mostrato in Figura 7.10, la se- 
quenza tra i siti di restrizione per EcoRI e PstI viene quindi alterata. L’oligonu- 
cleotide viene costruito mantenendo invariati i siti di restrizione per EcoRI e Pstl, 
assolutamente richiesti per il clonaggio del DNA in plasmide. .Le sequenze tra 
questi due siti vengono degenerate ad un livello tale che, in media, ogni oligonu- 
cleotide prodotto conterrà una singola variazione rispetto alla sequenza wild- 
type. Due esempi di oligonucleotidi prodotti sono mostrati in Figura 7.10. Sce- 
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1/1 EcoRI 28/10 Pstl 
5'-ATG CTG AAT TCT ATC GAA CAA GCA TGC GAT ATT TGC CTG CAG AAA-3' 
3'-TAC GAC TTA AGA TAG CTT GTT CGT ACG CTA TAA ACG GAC GTC TTT-5'! 
M L N Ss I E Q A c D I c L Q K 


Costruire un primer 
tra i siti di restrizione 


5'-GAATTCtatcgaacaagcatgegatatttgoCTGCAG-3'! 


Sintetizzare i primer 
degenerati 


5'-GAATTCtatcgaacaagcatgcAatatttgoCTGCAG-3'! 
5'-GAATTCtatcgGacaagcatgoegatatttgoCTGCAG-3' 


Riscaldare e raffreddare 
lentamente per il riappaiamento 


dei filamenti 
5'-GAATTCtatcgaacaagcatgcAatatttgoCTGCAG-3' 
3'-GACGTCcgtttatagegtacgaacaGgetatCTTAAG-5! 


DNA polimerasi 
+ dNTP 


5'-GAATTCtatcgaacaagcatgcAatatttgoCTGCAGgcaaatategcatgettgtCogataGAATTC-3'! 
3'-CTTAAGatagcttgttoegtacgTtataaacgGACGTCcgtttatagogtacgaacaGgetatCTTAAG-5! 


Tagliare con EcoRI 
e Pstl 


5'-AATTCtatcgaacaagcatgcAatatttgoCTGCA-3'! 
3'-GatagcttgttoegtacgTtataaacgG-5' 


5'-AATTCtatcgGacaagcatgocgatatttgoCTGCA-3'! 
3'-GatagcCtgttegtacgetataaacgG-5' 


Clonare le cassette 
in un vettore 


1/1 EcoRI 28/10 Pstl 
5!-ATG CTG AAT TCT ATC GAA CAA GCA TGC AAT ATT TGC CTG CAG AAA-3' 
3'-TAC GAC TTA AGA TAG CTT GTT CET ACG TTA TAA ACG GAC GTC TTT-5' 
W te ON gi TR o £ @ WD TR hd OR 


EcoRI 28/10 Pstl 


5'-ATG CTG AAT TCT ATC GGA CAA GCA TGC GAT ATT TGC CTG CAG AAA-3' 
3'-TAC GAC TTA AGA TAG CCT GTT CGT ACG CTA TAA ACG GAC GTC TTT-5' 
M L N s I G Q A (e D E (& L Q K 


Figura 7.10. Cassette degenerate per l'introduzione di mutazioni casuali all’interno di una specifica 
porzione genica. Vedi il testo per ulteriori dettagli. 


gliendo un livello appropriato di degenerazione, ciascun nucleotide in questa re- 
gione può essere alterato in qualunque altro nucleotide, ma consentendo un unico 
cambiamento per oligonucleotide. Gli oligonucleotidi prodotti in questo modo 
sono a singolo filamento per cui non possono essere clonati direttamente nel pla- 
smide a doppio filamento precedentemente digerito. La cassetta può essere tra- 
sformata a doppio filamento in due modi. O si sintetizzano due oligonucleotidi 
degenerati e complementari che s1 appaiano tra loro per formare i due filamenti 


adorno 


»-.-}— nat 
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di DNA, oppure si utilizza la natura palindromica dei siti di riconoscimento degli 
enzimi di restrizione all’estremità dell’oligonucleotide per creare molecole chi- 
meriche che possono essere tagliate dagli enzimi di restrizione e clonate in pla- 
smide. Il primo metodo si affida a mutazioni complementari presenti nei due fila- 
menti di DNA, e soffre del fatto che gli appaiamenti errati prodotti da mutazioni 
tra le coppie di oligonucleotidi non vengano tollerati durante la formazione del 
DNA a doppio filamento, limitando il numero di mutazioni presenti in ciascuna 
cassetta. Il secondo metodo (come mostrato in Fig. 7.10) è più appropriato, dato 
che le mutazioni presenti nella libreria di oligonucleotidi a singolo filamento ver- 
ranno conservate nella forma a doppio filamento. 


PCR soggetta ad errore. Abbiamo già discusso la tendenza ad introdurre errori 
da parte di certe DNA polimerasi impiegate nella PCR (Capitolo 4). In partico- 
lare, l'assenza di una attività esonucleasica di correzione di bozze 3°-5’ nella Tag 
DNA polimerasi implica che varie mutazioni possano essere introdotte nei pro- 
dotti di PCR semplicemente come conseguenza della stessa PCR (Keohavong e 
Thilly, 1989). Il vantaggio di questo metodo per l'introduzione di mutazioni ca- 
suali (Fig. 7.11) sta nel fatto che richiede una sola reazione di PCR. I prodotti di 
PCR possono quindi essere clonati e sottoposti ad analisi funzionale. Il tasso di 


RI 
Zi 
dda 
Se 
3 = 5° 
5 Ce 
PCR soggette 
a. ad errori 


Figura 7.11. PCR soggetta ad errori come metodo per la mutagenesi di un gene. La tendenza di 
alcune DNA polimerasi ad introdurre errori durante la PCR può creare varie mutazioni nel DNA 
amplificato. Le condizioni sperimentali della PCR possono essere modificate per aumentare il tasso 
di errore in modo che, in media, ogni prodotto amplificato a doppio filamento contenga una singola 
mutazione. 
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errore della Tag DNA polimerasi può essere aumentato, per incrementare la fre- 
quenza delle mutazioni introdotte, modificando varie condizioni sperimentali 
della reazione di PCR. Ad esempio, un aumento della concentrazione di magne- 
sio nella miscela di reazione o l'aggiunta di ioni manganese aumenterà il tasso di 
errori della polimerasi (Lin-Goerke, Robbins e Burczak, 1997). Inoltre, cambia- 
menti nella concentrazione degli oligonucleotidi, nella concentrazione della 
stessa polimerasi o nella lunghezza della fase di estensione della reazione sono 
altre condizioni che potrebbero essere modificate per aumentare il tasso di errore. 
La facilità con cui è possibile eseguire una mutagenesi casuale mediante PCR ha 
reso questa tecnica molto popolare. La principale limitazione di questa tecnica è 
la sua dipendenza da un enzima per l'introduzione di mutazioni casuali. Le DNA 
polimerasi mostrano specifiche preferenze verso alcuni tipi di errore. Nel caso 
della Taq DNA polimerasi, le transizioni sono favorite rispetto alle trasversioni 
(Keohavong et al., 1993), pertanto determinate mutazioni sono molto difficili da 
ottenere. 


7.7 Ingegneria proteica 


L’ingegneria proteica può essere immaginata come un processo per la modifica- 
zione deliberata di una proteina (attraverso l'alterazione della sequenza di DNA 
che la codifica) per conferire alla stessa una nuova o diversa funzione. Questo ap- 
proccio è stato impiegato per la creazione di enzimi con caratteristiche alterate che 
possano risultare utili a svolgere particolari compiti. Le caratteristiche enzimatiche 
che possono essere alterate includono: 


* termostabilità 

* stabilità in funzione del pH 

e proprietà cinetiche 

* stabilità in solventi organici 

* differente richiesta di cofattori 

* alterata specificità di legame col substrato 

* resistenza a proteasi 

e differente regolazione allosterica. 

L’ingegneria proteica è stata impiegata per alterare la stabilità termica del lisozima 
in modo diretto (Matsumura, Signor e Matthews, 1989). Il fondamento logico di 


questi esperimenti stava nel fatto che i ponti disolfuro tra residui di cisteina all’in- 
terno della proteina ne dovrebbero bloccare la struttura in una conformazione più 
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resistente alla denaturazione termica. Il gene codificante per il lisozima del bat- 
teriofago T4, un enzima privo di ponti disolfuro, è stato ingegnierizzato me- 
diante l’introduzione di codoni di cisteina nella sua sequenza in modo da for- 
mare ponti disolfuro tra i residui 3-97, 9-194 e 21-142. La proteina mutante 
viene denaturata a 66°C, rispetto ai 42°C della controparte wild-type (Matsumara, 
Signor e Matthews, 1989). 

L’ingegneria proteica può anche essere utilizzata per modificare la specificità 
di un enzima in modo che questo sia capace di catalizzare una reazione con sub- 
strati alternativi. Ad esempio, una singola mutazione puntiforme nel gene dell’alcol 
deidrogenasi I di lievito, che converte l’aspartato 233 in glicina, porta alla forma- 
zione di una proteina che, invece di impiegare esclusivamente NAD* come cofat- 
tore per la riduzione di acetaldeide in etanolo, può impiegare indifferentemente 
NAD* e NADP* (Fan, Lorenzen e Plapp, 1991). In un esempio più estremo, la lat- 
tato deidrogenasi del batterio Bacil/us stearothermophilus è stata convertita, attra- 
verso la mutazione di tre aminoacidi del sito attivo, in una malato deidrogenasi ad 
elevata attività (Wilks er a/., 1988). In entrambi questi casi le alterazioni sono state 
introdotte alla luce delle strutture ad alta risoluzione note per entrambe le proteine 
e hanno convertito l’attività enzimatica naturale in un’altra attività più o meno si- 
mile. Un problema più difficile è la creazione di proteine che abbiano funzioni to- 
talmente nuove. Alcuni risultati in questo campo sono stati ottenuti impiegando l’e- 
voluzione direzionata, un metodo per cui cicli multipli di mutagenesi casuale ini- 
ziati su un gene codificante una proteina a funzione nota vengono combinati con 
processi di selezione per produrre una proteina con una nuova specifica funzione. 
Ad esempio, Olsen et al. (2000), hanno impiegato il phage display (Capitolo 6) e 
la mutagenesi casuale per isolare proteasi con nuove specificità di substrato (Olsen 
et al., 2000). Questo approccio risulta particolarmente efficace per generare pro- 
teine con caratteristiche alterate piuttosto che proteine totalmente nuove. Ad esem- 
pio, Williams et al., hanno impiegato l’evoluzione direzionata per alterare il corso 
stereochimico di una reazione catalizzata dall’aldolasi per tagatosio-1,6-bifosfato 
(Williams et al., 2003). Dopo tre cicli di mutagenesi e i relativi saggi funzionali, è 
stata prodotta una aldolasi evoluta con un cambiamento di stereospecificità dell’or- 
dine di 100 volte verso il substrato non naturale costituito da fruttosio 1,6-bifo- 
sfato. L'enzima alterato contiene quattro cambiamenti in specifici residui aminoa- 
cidici rispetto all'originale aldolasi per tagatosio-1,6-bifosfato, e i cambiamenti 
sono dispersi lungo l’intera lunghezza del polipeptide. Ciascuno di questi cambia- 
menti produce un’alterazione del sito attivo della proteina quando si ripiega nella 
sua tipica struttura tridimensionale. 


Produzione e purificazione 
di proteine 


Concetti chiave 


+ La produzione di una proteina può essere incrementata ponendo il 
gene che la codifica sotto il controllo di un promotore forte 


+ Promotori forti e inducibili consentono la produzione di proteine altri- 
menti tossiche e di controllarne la produzione in funzione di specifi- 
che condizioni 


+ Le proteine possono essere prodotte in cellule batteriche o euca- 
riotiche 


+ II DNA codificante per “etichette” peptidiche facilmente rilevabili con 
anticorpi viene aggiunto spesso al gene espresso per facilitare il 
processo di purificazione della corrispondente proteina 


+ Le “etichette” peptidiche conferiscono proprietà uniche alle proteine 
sovra-espresse in modo che queste possano essere facilmente puri- 
ficate con approcci biochimici 


La produzione e purificazione di proteine per analisi biochimiche e strutturali ha 
costituito le fondamenta di molti dei recenti progressi dell’ingegneria genetica, 
della creazione di farmaci e della chimica medica. Alcune proteine vengono natu- 
ralmente espresse a livelli elevati, ma molte altre, anche di grande importanza bio- 
logica, sono invece espresse a livelli bassi. Ad esempio, molti dei fattori di trascri- 
zione responsabili dell'accensione e dello spegnimento di gruppi di geni sono pre- 
senti solo in poche copie per cellula. Al fine di facilitare lo studio delle proteine 
espresse a bassi livelli è necessario sovra-esprimere i geni che le codificano. Il 
modo più diretto per ottenere questo risultato è porre il gene d’interesse sotto il 
controllo di un promotore forte. Un promotore forte, generalmente derivato da un 
gene espresso a livelli elevati, amplificherà l’espressione di qualunque gene posto 
sotto il suo controllo mediante il reclutamento dell'RNA polimerasi richiesta per la 
sua trascrizione. 
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Figura 8.1. L'architettura di un vettore di espressione. Un vettore d'espressione dovrebbe contenere 
un promotore inducibile forte, un sito di clonaggio multiplo per l'inserimento del gene bersaglio, e un 
terminatore della trascrizione. Inoltre, può essere incluso un sito di legame al ribosoma (RBS) per 
rendere più efficiente la traduzione. 


Molti sforzi sono stati indirizzati allo sviluppo di vettori di espressione in 
grado di massimizzare la produzione di proteine. L'architettura di un tipico vettore 
di espressione è illustrata in Figura 8.1. Tali vettori spesso contengono un sito di 
clonaggio multiplo localizzato tra un promotore trascrizionale forte ed una se- 
quenza di terminazione. Inoltre, il vettore di espressione, contiene un'origine di re- 
plicazione ed un marcatore selezionabile, in modo che il vettore possa replicarsi 
autonomamente e rimanere presente all’interno delle cellule. 

Ad alti livelli, però, molte proteine risultano tossiche per la cellula ospite nella 
quale vengono prodotte, ed alcune proteine sono tossiche anche se prodotte in pic- 
cole quantità. Ad esempio, l’espressione del prodotto genico del poliovirus 3AB è 
estremamente dannoso per le cellule di E. coli, a causa dei cambiamenti drastici 
che esso induce nella permeabilità della membrana batterica (Lama e Carrasco, 
1992). Pertanto, per massimizzare l’espressione della proteina è cruciale disporre 
di un sistema di espressione inducibile. La produzione della proteina può essere at- 
tivata rapidamente, raccogliendo le cellule subito dopo l’induzione, prima che si 
manifestino gli effetti tossici della sovra-produzione di proteina. Qui discuteremo 
vari sistemi di espressione inducibile che oggi sono di uso comune. Inoltre, descri- 
veremo i vettori più diffusamente utilizzati per la produzione di proteine in E. coli, 
lievito e in cellule di insetti e mammiferi. 


8.1 Espressione in E. coli 


E. coli resta la cellula ospite d'elezione per la maggior parte degli esperimenti di 
espressione proteica. La sua rapida divisione (30 min) in condizioni semplici (e 
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poco costose), unita all’approfondita conoscenza delle sequenze dei suoi promotori 
e terminatori, fa sì che molte proteine, sia di origine procariotica che eucariotica, 
possano essere prodotte in questo organismo. Naturalmente, E. coli, quando viene 
utilizzato per la produzione di proteine eucariotiche, ha delle limitazioni legate alla 
sua natura di organismo procariotico. Le cellule di E. coli non sono in grado di ri- 
muovere introni e non posseggono il complesso macchinario di modificazione 
post-traduzionale presente nelle cellule eucariotiche in grado di glicosilare, meti- 
lare, fosforilare o alterare in molti altri modi le proteine inizialmente prodotte, ad 
esempio con la formazione di vari ponti disolfuro. L'utilizzo di cDNA in un vettore 
di espressione supera il primo dei problemi menzionati, ma nel caso in cui siano 
necessarie modificazioni post-traduzionali per ottenere una proteina funzionale si è 
costretti ad utilizzare organismi alternativi. 

Differenti sequenze di promotori sono state impiegate per la produzione di pro- 
teine inducibili in E. coli (Makrides, 1996). Alcuni di questi promotori sono di se- 
guito descritti. 


8.1.1 Il promotore lac 


Abbiamo già visto (Fig. 1.23) che il promotore /ac di E. coli fornisce un meccanismo 
per l’espressione genica inducibile. I geni /ac vengono espressi ai massimi livelli 
quando £. coli cresce in un terreno ricco di lattosio. Fondendo le sequenze del pro- 
motore /ac ad un altro gene si potrà ottenere una espressione lattosio- (o IPTG-) di- 
pendente dello stesso gene. Il promotore /ac presenta, tuttavia, una serie di problemi 
che fanno sì che esso venga raramente utilizzato per regolare l’espressione dei geni 
bersaglio. In primo luogo, il promotore /ac è piuttosto debole e non permette di otte- 
nere una elevata produzione della proteina; secondariamente, i geni /ac vengono tra- 
scritti a livelli significativi anche in assenza di induzione (Gronenborn, 1976). L'ul- 
timo problema può essere parzialmente superato attraverso l’espressione di versioni 
mutanti del gene /ac/ che aumentano l’efficienza del legame al DNA del suo pro- 
dotto (e conseguentemente l'efficacia della repressione); ad esempio, l’allele /ac/? è 
in grado di aumentare sensibilmente la produzione di /ac/ con conseguente riduzione 
del livello di trascrizione in assenza d’induttore (Miiller-Hill, Crapo e Gilbert, 1968). 


8.1.2 Il promotore tac 


La facilità con cui il promotore /ac può essere attivato (aggiungendo IPTG alle col- 
ture di E. coli) lo rende un sistema attraente per la produzione di proteine d’inte- 
resse. Tuttavia, la relativa debolezza del promotore implica che non si potranno otte- 
nere livelli elevati di proteina. Mediante l’analisi di numerosi promotori di £. coli, 
sono state caratterizzate in dettaglio le sequenze consenso delle regioni -35 e -10, a 
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-35 -10 
consenso consenso 
5'-TTGACA-3' 5'-TATAAT-3' 

lac: 5'-.. . TITACACTITATECTTCCEGCICEIATATTGICGIEGAATTETEAGCGGATAACAATITCACACAGGARACAGCIT ATG...-3' 

-35 —10 RBS Proteina 
trp: 5'-.. -FIGACAATTAATCATCGAACTAGITAACTAGTACGCAAGITCACGTAAAAAGGGTATCGACA ATG...-3' 

-—35 -10 RBS Protein 
tac: 5'-.. .{FIGACAATTAATCATCOSCICGTATAATGTGTGGAATTETGAGCGGATAACAATITCACACAGGARACAGGG ATG...-3' 

-—35 -10 RBS Proteina 


Figura 8.2. La sequenza di DNA dei promotori /ac, trp e tac. In alto sono mostrate le sequenze con- 
senso —35 e —10 di E. coli basate sull'analisi di numerosi promotori naturali; sotto sono riportate le 
sequenze di ciascuno dei promotori che si estendono dalla regione —35 al sito d’inizio della tradu- 
zione. Il promotore tac è un ibrido tra il promotore /ac e il promotore trp. Le regioni -35 e —-10 che 
esso contiene rispecchiano fedelmente le sequenze consensus. Il promotore tac è approssimativa- 
mente cinque volte più forte del promotore /ac, ma rimane inducibile da lattosio o IPTG. 


cui si deve legare l' RNA polimerasi per la trascrizione del gene (Lisser e Margalit, 
1993). Il promotore /ac è debole perché la regione —35 diverge dal “consensus” 
(Fig. 8.2). La creazione di una sequenza di fusione contenente la regione —35 del- 
l’operone trp di E. coli, e la regione — 10 dell’operone /ac, che controllano, rispetti- 
vamente, l’espressione dei geni responsabili della biosintesi del triptofano e del 
metabolismo del lattosio, ha portato alla creazione del promotore tac, che risulta 
cinque volte più forte dello stesso promotore /ac (de Boer, Comstock e Vasser, 
1983). Il promotore fac è in grado d’indurre l’espressione di geni bersaglio in 
modo che il polipeptide codificato si possa accumulare a livelli pari al 20-30% 
della massa proteica cellulare complessiva (Amann, Brosius e Ptashne, 1983). Vet- 
tori di espressione contenenti il promotore fac contengono anche l'operatore /acO 
e normalmente il gene /ac/ codificante per il repressore Lac (Stark, 1987). Geni 
clonati in questi vettori sono quindi inducibili da IPTG e possono essere repressi o 
indotti in diversi ceppi di E. coli (Fig. 8.3). 


8.1.3 Il promotore AP, 


Il promotore 4P, è responsabile della trascrizione della porzione sinistra del ge- 
noma di À, inclusi i geni N e cIII (vedi Capitolo 3). Il repressore À, prodotto dal 
gene cl, reprime il promotore. Due strategie di base vengono utilizzate per attivare 
il promotore AP,. Nella prima, un mutante temperatura-sensibile di cl (c1857) 
viene utilizzato insieme a ÀP, per l’espressione dei geni bersaglio (target) (Hendrix, 
1983). Durante la crescita a 30°C il mutante della proteina cl è in grado di legarsi 
al promotore AP, e operare la repressione. Oltre i 30°C, tuttavia, la proteina cI 
mutante perde questa capacità, e di conseguenza il promotore ÀP, viene attivato 
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Figura 8.3. La produzione in £. coli di tre differenti proteine la cui espressione è modulata dal pro- 
motore tac. Cellule batteriche contenenti il vettore d'espressione basato sul promotore tac, vengono 
fatte crescere in una coltura liquida, quindi viene aggiunto IPTG, come indicato, a metà di ogni col- 
tura. La crescita viene quindi continuata per altri 90 min prima che le cellule vengano raccolte, rotte e 
le proteine estratte sottoposte a elettroforesi su gel di SDS-poliacrilamide. Il contenuto proteico di 
ciascuna coltura cellulare è stato visualizzato dopo la colorazione del gel con blu Comassie. Viene 
indicata la posizione delle bande relative alle tre proteine prodotte in seguito a induzione da IPTG. 


(Bernar et al., 1979). Questo metodo produce elevati livelli di produzione della 
proteina target, ma lo stimolo termico necessario per indurre la sua produzione può 
essere difficile da controllare. Un secondo modo per indurre il promotore AP, è la 
trasfofmazione del vettore di espressione in un ceppo di E. coli in modo che il gene 
cI sia sotto il controllo del promotore fp, che viene strettamente regolato. L'e- 
spressione del gene target può essere indotta dall’aggiunta di triptofano al mezzo di 
coltura, che impedirà la trascrizione del gene cI, con conseguente attivazione del 
promotore AP, . Questo sistema può essere controllato così strettamente da poter 
essere utilizzato anche per produrre proteine altamente tossiche (Wang, Deems e 
Tennis, 1997; Celis er al., 1998). 


8.1.4 Il sistema di espressione T7 


La RNA polimerasi codificata dal batteriofago T7 è differente dalla controparte di 
E. coli. A differenza della struttura 0,8, dell’enzima di E. coli, la RNA polimerasi 
T7 è un enzima costituito da un’unica subunità che si lega a una precisa sequenza 
promotrice della lunghezza di 17 bp (5°--TAATACGACTCACTATA-3°) localizzata 
a monte dei geni virali trascritti dall’RNA polimerasi di T7. La RNA polimerasi di 
E. coli non riconosce le sequenze promotrici di T7 per iniziare la trascrizione. In 
Figura 8.4 è mostrato lo schema generale per la produzione di proteine target uti- 
lizzando il sistema T7 (Studier e Moffatt, 1986: Studier et a/., 1990). Il gene target 
viene clonato in un vettore di espressione plasmidico in modo che sia sotto il con- 
trollo del promotore T7. La propagazione di questo plasmide in cellule di £. coli 
wild-type non potrebbe ottenere la produzione della proteina target dato che in 
queste cellule non è presente la RNA polimerasi di T7. Per ottenere l’espressione 
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RNA polimerasi Î IPTG si dissocia dal repressore lac Î 
di E. coli per iniziare la trascrizione 
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Figura 8.4. ll sistema T7 per l’espressione di proteine in E. coli. Il vettore di espressione (pET) con- 
tiene il gene target sotto il controllo del promotore per la RNA polimerasi di T7. Il vettore è trasfor- 
mato in un ceppo di E. coli che contiene, integrato nel suo genoma, una copia del gene per la poli- 
merasi T7 (T7 gene 1) sotto il controllo del promotore /ac. Inoltre, i promotori sia per il gene target 
che per il gene di T7 contengono la sequenza dell'operatore /acO, risultando quindi inibiti dal repres- 
sore lac (/acl). Linduzione da IPTG consente la trascrizione del gene per la RNA polimerasi T7 il cui 
prodotto proteico successivamente attiva l’espressione del gene target. La presenza di un plasmide 
addizionale nelle cellule di E. coli in grado di produrre il lisozima T7 inattiva ogni RNA polimerasi T7 
prodotta in assenza d’induzione. Dopo l’induzione viene prodotta una quantità sufficiente di RNA po- 
limerasi T7 per sfuggire a questo meccanismo di regolazione. Ristampa autorizzata da Novagen Inc. 


del gene target, il plasmide di espressione viene trasformato in un ceppo di £. coli 
contenente una copia del gene 1 di T7 sotto il controllo del promotore /ac. Tali se- 
quenze possono essere trasferite nella maggior parte dei ceppi di E. coli utilizzando 
un À lisogeno denominato DE3 che contiene il gene per la polimerasi T7 sotto il 
controllo del promotore /acUVS (Fig. 8.4). Quindi, l’induzione da IPTG promuo- 
verà la sintesi della RNA polimerasi di T7 che si legherà al promotore T7 e guiderà 
l’espressione del gene target. Come abbiamo già notato, il promotore /ac potrà 
esprimere piccole quantità del gene sotto il suo controllo anche in assenza di indut- 
tore. L'aggiunta di una sequenza /acO tra il promotore T7 e il gene target nel vettore 
di espressione riduce il livello di espressione del gene target (Dubendorff e Studier, 
1991). Per minimizzare la produzione non controllata della RNA polimerasi T7 (as- 
sicurandosi quindi di minimizzare l’espressione del gene target) le cellule di E. coli 
possono essere co-trasformate con un plasmide addizionale. Come mostrato in Fi- 
gura 8.4, il plasmide pLysS, che utilizza un’origine di replicazione differente, ma 
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compatibile, del vettore di espressione, produrrà il lisozima T7, un inibitore natu- 
rale della RNA polimerasi T7. La produzione di questo inibitore bloccherà i ridotti 
livelli di polimerasi prodotti in assenza d’induzione, ma verrà sovrastata, e quindi 
resa inefficace, dalle grandi quantità di polimerasi prodotte durante l’induzione. 

Nonostante siano disponibili ottimi promotori in grado di realizzare elevati li- 
velli di produzione di RNA, molte proteine non possono essere prodotte in cellule 
di E. coli. La forza del promotore non è necessariamente il fattore più importante 
per determinare 1 livelli con cui la proteina si accumulerà all’interno della cellula. 
Alcuni fattori addizionali sono di seguito elencati. 


* Livelli del vettore di espressione. Semplicisticamente, si potrebbe immaginare 
che aumentando il numero di copie del vettore d'espressione si incrementerebbe 
la produzione della proteina da esso codificata. Ci sono, tuttavia, casi documen- 
tati, in cui ad un numero di copie molto elevato del vettore d’espressione (ri- 
spetto ai valori ottenuti per pBR322) non corrisponde una elevata produzione di 
proteina (Yansura e Henner, 1990), e altri ancora in cui accresciuti livelli del vet- 
tore provocano addirittura una diminuzione della produzione (Vasquez et al., 
1989). I vettori d’espressione attualmente più diffusi in commercio contengono 
l'origine di replicazione sia di pBR322 che di pUC (Capitolo 3), e l'alterazione 
del numero di copie non viene generalmente utilizzata per modulare la produ- 
zione di proteina, anche se alcuni sistemi di questo tipo sono disponibili (Wild, 
Hradecna e Szybalski, 2001). 


e Terminazione della trascrizione. Sebbene spesso trascurata nella realizzazione di 
vettori d’espressione, l'efficiente terminazione della trascrizione è una compo- 
nente essenziale per ottenere elevati livelli di espressione genica. I terminatori in- 
crementano la stabilità dell’mRNA (Hayashi e Hayashi, 1985) e possono portare 
ad un sostanziale incremento della quantità di proteina accumulata (Vasquez ef 
al., 1989). I due terminatori della trascrizione in tandem (T1 e T2) dell’operone 
per rRNA rrnB di E. coli (Brosius et al., 1981) sono spesso presenti nei vettori 
d’espressione, ma anche altri terminatori si comportano abbastanza bene. 


* Strategia dell’uso dei codoni. La degenerazione del codice genetico comporta il 
fatto che più di un codone può codificare per uno stesso aminoacido nella sintesi 
di una catena polipeptidica. Sia i geni di procarioti che di eucarioti usano i co- 
doni in modo non casuale. I geni che contengono codoni preferiti saranno tradotti 
con efficienza maggiore di geni contenenti codoni usati meno frequentemente. 
Questo effetto è particolarmente rilevante nei geni che sono altamente espressi in 
E. coli, dove si osserva un elevato livello di preferenza dei codoni. In generale, la 
frequenza di utilizzo di codoni alternativi riflette l'abbondanza delle corrispon- 
denti molecole di tRNA. Ad esempio, il poco abbondante tRNAA"£ (AGG/AGA) è 
stato mostrato essere un fattore limitante nella produzione di diverse proteine di 
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mammifero (Brinkmann, Mattes e Buckel, 1989) dato che i codoni AGG e AGA 
sono poco utilizzati in E. coli. La co-espressione del gene codificante per il 
tRNAAT&(AGG/AGA) (dnaY) può indurre una maggiore produzione della proteina 
target, normalmente limitata dalla scarsa disponibilità di questo tRNA. Sono stati 
messi a punto sistemi per l’espressione di altre molecole di tRNA che ricorrono 
frequentemente nelle sequenze codificanti di mammifero, ma che sono raramente 
usate da E. coli. Un sistema di questo tipo utilizza un ceppo batterico (denomi- 
nato Rosetta!M) in grado di esprimere i tRNA per AGG, AGA, AUA, CUA, CCC 
e GGA su un plasmide compatibile con il vettore d’espressione. Un approccio al- 
ternativo, anche se richiede tempi più lunghi, per superare il problema della pre- 
senza di codoni rari è quello di mutare il gene che deve essere espresso in modo 
che esso contenga i codoni più frequentemente utilizzati nei geni altamente 
espressi in E. coli. Cioè, la sequenza di DNA del gene viene alterata in modo da 
contenere i codoni maggiormente preferiti dal sistema traduzionale della cellula 
ospite senza modificare il polipeptide codificato. Non c’è tuttavia una semplice 
correlazione diretta tra la presenza di codoni rari all’interno di un gene e i livelli a 
cui la proteina viene prodotta. Una combinazione di codoni rari all’interno di una 
sequenza target ed altri fattori riduce l’efficienza complessiva della traduzione. 


Sequenza della proteina. La sequenza aminoacidica della proteina target gioca un 
ruolo importante nel determinarne i livelli di accumulo. La regola dell’ “N-termi- 
nale”, descritta per la prima volta nel laboratorio di Alexander Varshavsky, correla 
la stabilità della proteina alla sequenza alla sua estremità amino-terminale (Bach- 
mair, Finley e Varshavsky, 1986; Varshavsky, 1992). In E. coli, residui amino-ter- 
minali di Arg, Lys, Leu, Phe, Tyr e Trp localizzati immediatamente dopo la metio- 
nina iniziatore comportano una vita media della proteina inferiore a 2 min. Altri 
residui aminoacidici nella stessa posizione e nella stessa proteina conferiscono 
una vita media di oltre 10 h (Tobias et a/., 1991). Ci sono anche altri fattori di 
controllo della stabilità sequenza-dipendente, vedi la review di Makrides (1996). 


Degradazione delle proteine. E. coli è spesso considerato una fabbrica biomole- 
colare per la sintesi di DNA e proteine. Naturalmente, l’organismo è altamente 
sviluppato e contiene meccanismi multipli per rimuovere possibili sostanze tossi- 
che. Ad esempio, E. coli contiene un gran numero di proteasi localizzate nel cito- 
plasma e nel periplasma e associate con la membrana interna ed esterna (Chung. 
1993: Gottesman, 1996). La proteolisi impedisce l'accumulo di proteine regola- 
trici critiche, e libera anche la cellula da proteine anormali o ripiegate in modo 
scorretto. Le proteine target espresse in £. coli possono assumere una struttura 
anomala per una varietà di cause, come l’esposizione di residui idrofobici che 
sono normalmente nella parte interna della proteina, l’assenza dei suoi normali 
partner d’interazione e modificazioni post-traduzionali inappropriate o assenti. 
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Alcuni metodi utilizzati per contrastare gli effetti della proteolisi comprendono 
l’utilizzo di ceppi di £. coli deficienti in proteasi; la crescita cellulare a bassa 
temperatura; l’espressione della proteina target fusa ad un una proteina notoria- 
mente stabile; la localizzazione della proteina prodotta nel periplasma dove c’è 
una minore presenza di proteasi (Murby, Ulhén e Stàhl, 1996). 


Nonostante le limitazioni sopra discusse, E. coli rimane un sistema ampiamente 
utilizzato per la produzione di proteine. Alcuni dei sistemi d'espressione che pos- 
sono essere utilizzati in laboratorio non sono, tuttavia, adatti per la produzione di 
proteine su larga scala. Ad esempio l’induzione con IPTG delle proteine umane ad 
utilizzo terapeutico non è realizzabile a causa dei costi di induzione di grosse cul- 
ture e la potenziale tossicità dello stesso IPTG (Figge et al., 1988). 


8.2 Espressione in lievito 


Tra gli eucarioti, i lieviti presentano molte delle caratteristiche delle cellule degli 
eucarioti superiori, come le modificazioni post-traduzionali, ma, allo stesso tempo, 
sono facili da manipolare quasi come £. coli. La crescita cellulare del lievito è più 
rapida, più facile e meno costosa rispetto a quella di altre cellule eucariotiche, ed è 
generalmente caratterizzata da elevati livelli d'espressione. Tre specie principali di 
lievito vengono impiegate per la produzione di proteine ricombinanti: Saccharomy- 
ces cerevisiae, Pichia pastoris e Schizosaccharomyces pombe. 


8.2.1 Saccharomyces cerevisiae 


Il lievito della panificazione, S. cerevisiae, è un eucariote unicellulare che cresce 
rapidamente (raddoppia la sua massa in circa 90 min) in mezzi di coltura semplici 
e ben definiti simili a quelli utilizzati per la crescita delle cellule di E. coli. Le pro- 
teine prodotte da £. coli contengono molte, ma non tutte, le modificazioni post-tra- 
duzionali presenti nelle cellule degli eucarioti superiori. Ad esempio, la a-1-antitri- 
psina umana, una sieroproteina di 52kDa coinvolta nel controllo della coagulazione 
e nella fibrinolisi, è normalmente glicosilata. Tuttavia, se la proteina viene prodotta 
in E. coli, la glicosilazione presenta caratteristiche molto differenti, anche se av- 
viene nelle stesse posizioni della proteina umana (Moir e Dumais, 1987). 

Numerosi promotori costitutivi forti sono stati impiegati per guidare l’espres- 
sione di geni target in lievito. Per esempio, i promotori per i geni codificanti per la 
fosfoglicerato chinasi (PGK), la gliceraldeide-3-fosfato deidrogenasi (GPD) e l’al- 
col deidrogenasi (ADHI1) sono stati tutti impiegati per la produzione di proteine 
target (Cereghino e Cregg, 1999). Tuttavia, tali promotori presentano gli stessi 
problemi dei promotori costitutivi dei sistemi d’espressione in E. coli. Viene nor- 
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malmente utilizzata una varietà di sistemi per la produzione inducibile di proteine 
target in S. cerevisiae. Due di questi sono discussi nei paragrafi seguenti. 


8.2.1.1 Il sistema GAL 


Nel lievito, come in tutte le altre cellule, il galattosio è convertito in glucosio-6-fo- 
sfato mediante gli enzimi della via di Leloir. Ciascuno dei geni strutturali di questa 
via metabolica (noti collettivamente come geni GAL) viene espresso a livelli elevati, 
e rappresenta lo 0,5-1% dell’mRNA cellulare totale (St John e Davis, 1981), ma 
solo quando le cellule vengono cresciute utilizzando galattosio come unica fonte di 
carbonio. Ciascuno dei geni GAL contiene all’interno del suo promotore almeno un 
sito di legame, ma spesso più di uno, per l’attivatore trascrizionale Gal4p. Il legame 
di Gal4p a questi siti, e la sua attività trascrizionale nello stato legato, viene regolata 
dalla fonte di carbonio disponibile nella cellula. Quando il lievito viene fatto cre- 
scere su glucosio, la sua fonte di carbonio preferita, la trascrizione a partire dal pro- 
motore GALA (che regola la produzione di Gal4p) viene repressa in modo da ridurre 
la concentrazione di Gal4p nella cellula, con la conseguente riduzione del legame 
dell’attivatore ai promotori dei geni strutturali GAL (Griggs e Johnston, 1991). In al- 
tre fonti di carbonio, come il raffinosio, Gal4p viene prodotto e si lega ai promotori 
dei geni strutturali GAL, ma un repressore, Gal80p. inibisce la sua attività. Gal80p 
si lega direttamente a Gal4p e si ritiene che mascheri il suo dominio d’attivazione 
in modo che non possa essere reclutata la macchina trascrizionale (Lue 
et al., 1987). Solo in presenza di galattosio l’effetto inibitorio di Gal80p è ridotto, 
portando l’espressione inducibile della proteina target a livelli elevati. 

Per produrre una proteina target in S. cerevisiae utilizzando l’induzione da ga- 
lattosio, il gene codificante la proteina d'interesse deve essere clonato in modo da 
essere sotto il controllo di un promotore GAL. Il promotore del gene GAL/, codifi- 
cante per una galattochinasi è quello più comunemente utilizzato, ma sono anche 
disponibili promotori sintetici contenenti copie multiple dei siti di legame per 
Gal4p. Una volta costruito, il vettore d'espressione è introdotto tramite trasforma- 
zione in cellule di lievito e la produzione della proteina codificata viene innescata 
ponendo le cellule in un mezzo di coltura contenente galattosio. Le proteine pro- 
dotte in questo modo raramente si accumulano in quantità confrontabili ai livelli 
delle proteine ricombinanti ottenuti in cellule di £. coli. Non è normalmente possi- 
bile rilevare le proteine prodotte su gel colorati con Comassie, come quelli mostrati 
in Figura 8.3, e la produzione massima rappresenta solo 1° 1-5% delle proteine cel- 
lulari totali. È, quindi, necessario utilizzare il Western blotting o altri metodi per la 
rilevazione della proteina target. Una ulteriore difficoltà deriva dal fatto che Gal4p, 
l’attivatore dei geni GAL, è normalmente presente nella cellula di lievito a livelli 
molto bassi. Quindi, se il vettore d'espressione, contenente copie multiple dei siti 
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di legame per Gal4p, è un plasmide ad alto numero di copie, è probabile che non vi 
sia una quantità sufficiente di Gal4p per attivare l’espressione di tutti i geni target 
al livello massimo. Per superare questo problema sono stati costruiti ceppi di lie- 
vito in cui la sequenza codificante del gene GALA è stata posta sotto il controllo 
del promotore GAL (Schultz et al., 1987; Mylin er al., 1990). Questo attiva un ci- 
clo a feedback in cui l’induzione da galattosio aumenta anche la produzione di 
Gal4p che a sua volta aumenta l’espressione del gene target (Fig. 8.5). 


Gal4p prodotto dal suo promotore specifico 


Vettore di 
espressore 


Vettore di 
espressore 


Vettore di 
espressore 


Proteina target 


Gal4p prodotto dal promotore GALI 


Proteina 
target 


Figura 8.5. Espressione genica in lievito inducibile da galattosio. L'espressione dei geni da vettori 
multicopia sotto il controllo del promotore GAL1 (P1,;) può essere sostanzialmente incrementata se 
il gene GALA, che codifica per l’attivatore trascrizionale di GAL17, è anch'esso posto sotto il controllo 
di Pa; In questo caso, l’induzione da galattosio produrrà più Gal4p e di conseguenza una quantità 
maggiore di proteina target. 
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8.2.1.2 Il sistema CUPI 


Gli ioni rame (Cu?* e Cu*) sono essenziali a livelli appropriati, ma tossici a livelli 
elevati per tutti gli organismi viventi. Le cellule devono quindi mantenere un li- 
vello di rame tale da non essere troppo basso da causare deficienza o troppo alto da 
risultare tossico. In S. cerevisiae, l’omeostasi del rame comprende meccanismi di 
assorbimento, distribuzione e detossificazione (Eide, 1998). Ad elevate concentra- 
zioni, la detossificazione da ione rame è mediata da un fattore di trascrizione me- 
tallo-regolato sensibile alla concentrazione di ioni rame denominato Acelp. In se- 
guito all'interazione con il rame Acelp si lega al DNA a monte del gene CUP! 
(Winge, 1998), che codifica per una proteina metallotioneina, e induce la sua tra- 
scrizione. La trascrizione di CUP/ è rapidamente indotta dall’aggiunta al mezzo di 
rame esogeno ( Winge, Jensen e Srinivasan, 1998). I vettori d'espressione che con- 
tengono il promotore CUP/ possono quindi essere utilizzati per indurre l’espres- 
sione di un gene target in modo rame-dipendente (Mascorrogallardo, Covarrubias e 
Gaxiola, 1996). A differenza del sistema GAL, le culture di lievito che contengono 
il plasmide d’espressione CUP/ possono essere cresciute in terreni ricchi di fonti 
di carbonio, come il glucosio, ad elevata densità cellulare, e la produzione di pro- 
teina viene innescata aggiungendo solfato di rame (concentrazione finale di 0,5 
mM) alle colture. Una potenziale controindicazione di questo sistema è la presenza 
di ioni rame nel mezzo di coltura del lievito, o nell'acqua delle soluzioni. Pertanto, 
nello stato “off” che si dovrebbe avere prima dell’aggiunta del rame, si potrebbe 
comunque avere la produzione di quantità significative della proteina. 


8.2.2 Pichia pastoris 


Pichia pastoris è un lievito metilotrofico, in grado di metabolizzare metanolo come 
sua unica fonte di carbonio. Il primo passaggio nel metabolismo del metanolo è la 
sua ossidazione a formaldeide da parte dell'ossigeno molecolare (0,) per mezzo 
dell’enzima alcol ossidasi. L’alcol ossidasi ha scarsa affinità per O,, e P. pastoris 
compensa questa deficienza generando grandi quantità di questo enzima (Koutz er 
al., 1989). Il promotore che regola la produzione di alcol ossidasi (AOX/) può es- 
sere utilizzato per guidare l’espressione della proteina eterologa in P.pastoris 
(Tschopp et al., 1987) dato che è strettamente regolato e indotto da elevati livelli di 
metanolo. Le cellule di P. pastoris che contengono il vettore d'espressione, che è 
integrato nel genoma in singola copia o in copie multiple, sono fatte crescere in 
glicerolo (la crescita su glucosio reprime la trascrizione di AOX/, anche in pre- 
senza di metanolo) fino a raggiungere una densità estremamente elevata prima del- 
l’aggiunta di metanolo. Una volta indotte, le proteine target si possono accumulare 
a livelli molto elevati, spesso compresi tra 0.5 e 10 g di proteina per litro di coltura 
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di lievito. Per esempio, nell’espressione del gene codificante per l’antigene di su- 
perficie dell’epatite B si raggiungono concentrazioni di più di 1 g di antigene ri- 
combinante per litro di cellule di P. pastoris (Hardy et al., 2000). Tali concentra- 
zioni sono molto più elevate di quelle che è possibile raggiungere in S. cerevisiae. 
Inoltre, rispetto a S. cerevisiae, P. pastoris può avere dei vantaggi rispetto alla gli- 
cosilazione delle proteine secrete. Le glicoproteine generate da P. pastoris somi- 
gliano nella struttura alle glicoproteine che si trovano negli eucarioti superiori 
(Cregg, Vedvick e Raschke, 1993). 


8.2.3 Schizosaccharomyces pombe 


S. pombe è un organismo eucariotico unicellulare che possiede molte proprietà si- 
mili a quelle che si ritrovano negli eucarioti superiori. Tali proprietà, come la strut- 
tura e la funzione dei cromosomi, il controllo del ciclo cellulare, lo splicing del- 
UPRNA e la strategia di uso dei codoni, lasciano supporre che S. pombe sia un can- 
didato ideale per la produzione di proteine eucariotiche (Giga-Hama e Kumagai, 
1999). Inoltre, è più elevata la probabilità che le proteine espresse in S. pombe si 
ripieghino correttamente, in modo da ridurre l’insolubilità proteica associata con la 
produzione di molte proteine in E. coli. La produzione di proteine in S. pombe è 
generalmente controllata dall'espressione mediata dal promotore nmt/ (nessun 
messaggio con la tiamina) (Maundrell, 1993). Questo promotore è attivo, permet- 
tendo la trascrizione di geni a valle sotto il suo controllo, quando le cellule sono 
cresciute in assenza di tiamina. Al contrario, in presenza di una concentrazione di 
tiamina superiore a 0.5 uM, il promotore si spegne (Maudrell, 1990). I livelli com- 
plessivi di produzione di proteina sono confrontabili a quelli di S. cerevisiae. 


8.3 Espressione in cellule di insetto 


I baculovirus, sono virus a forma di bastoncino, che infettano gli insetti e linee cel- 
lulari d’insetti. Essi possiedono genomi di DNA circolare di dimensioni comprese 
tra 90 e 180 kbp (Ayres er al., 1994). L'infezione virale porta alla lisi cellulare, 
normalmente 3-5 giorni dopo l’infezione iniziale, e la successiva morte dell’insetto 
infetto. I virus della poliedrosi nucleare sono una classe di baculovirus che produ- 
cono corpi di inclusione nel nucleo delle cellule infette. Questi corpi d’inclusione 
sono primariamente costituiti da un’unica proteina, la poliedrina, che circonda le 
particelle virali e le protegge da ambienti sfavorevoli. Per la maggior parte dei vi- 
rus di questo tipo è necessario che essi vengano assunti dall’insetto attraverso l’ali- 
mentazione perché possa manifestarsi l’infezione, e i corpi d’inclusione proteg- 
gono le particelle virali dalla degradazione nell’intestino dell’insetto. Il gene per la 
poliedrina è trascritto a livelli molto elevati in una fase tardiva del processo d’infe- 
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zione (2-4 giorni dopo l’infezione). In cellule d’insetto in coltura, la produzione di 
corpi d’inclusione non è essenziale per l’infezione o la replicazione virale. Di con- 
seguenza, il promotore della poliedrina può essere utilizzato per guidare l’espres- 
sione di geni target. 

Il baculovirus della poliedrosi nucleare Autographa californica (AcNPV) è di- 
ventato uno strumento molto diffuso per la produzione di proteine ricombinanti in 
cellule d’insetto (Fraser, 1992). Esso viene utilizzato con linee cellulari d’insetto de- 
rivate dal lepidottero Spodoptera frugiperda. Queste linee cellulari (Sf9 e Sf21) sono 
facilmente coltivate in laboratorio, e uno schema per la costruzione di baculovirus ri- 
combinanti è mostrato in Figura 8.6. Le dimensioni del genoma di baculovirus gene- 
ralmente precludono il clonaggio diretto di un gene target. Piuttosto, il gene target 
viene clonato a valle del promotore per la poliedrina in un plasmide di trasferimento 
(Lopez-Ferber, Sisk e Possee, 1995). Il plasmide di trasferimento contiene anche le 
sequenze genomiche di baculovirus che fiancheggiano il gene per la poliedrina, sia a 
monte che a valle. Per produrre i virus ricombinanti, il plasmide di trasferimento ri- 
combinante è co-transfettato nelle cellule d’insetto con un vettore di DNA di baculo- 
virus linearizzato. Le regioni fiancheggianti del plasmide di trasferimento parteci- 
pano nella ricombinazione omologa con le sequenze del DNA virale e mediano l’in- 
troduzione del gene target nel genoma di baculovirus. Il processo di ricombinazione 
comporta anche la riparazione del DNA virale circolare, che permette alla replica- 
zione virale di procedere attraverso la riformazione della ORF1629 (una proteina del 
capside virale che è essenziale per la produzione di particelle virali). L'infezione vi- 
rale ricombinante è visibile al microscopio osservando le placche virali su uno strato 
di cellule d’insetto. Le placche che contengono il virus ricombinante non saranno in 
grado di formare corpi d’inclusione per l’assenza della proteina poliedrina funzio- 
nale (Smith, Summers e Fraser, 1983). Fare lo screening delle placche in questo 
modo è tuttavia tecnicamente difficile. Per questa ragione, il plasmide di riferimento 
normalmente contiene anche il gene /acZ, o un altro gene reporter facilmente visua- 
lizzabile, che permette l’identificazione visiva di placche ricombinanti per mezzo 
della colorazione blu che si ottiene mediante trattamento con X-Gal (Fig. 8.6). 
Dopo la transfezione e la purificazione delle placche per rimuovere la possibile 
contaminazione di virus parentale, viene preparato uno stock virale a titolo elevato 
che verrà utilizzato per l'infezione su larga scala di colture cellulari d’insetto per la 
produzione di proteina. Le cellule infette iniziano a produrre grosse quantità della 
proteina target, quindi muoiono e possono andare incontro a lisi. 

La produzione di proteina in cellule d’insetto infettate da baculovirus ha il van- 
taggio che si possono produrre grandi quantità di proteina rispetto ad altri vettori 
d’espressione eucariotici, e che il pattern di glicosilazione ottenuto è simile, ma non 
identico, a quello che si ritrova negli eucarioti superiori (Possee, 1997; Joshi et al., 
2000). I baculovirus hanno anche il vantaggio che geni multipli possono essere 
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Figura 8.6. La produzione di un genoma di baculovirus ricombinante per la produzione di proteine 

in cellule d’insetto. Il gene target viene clonato sotto il controllo del promotore per la poliedrina in un 
vettore di trasferimento che contiene anche le regioni del genoma virale che fiancheggiano il locus 

della poliedrina. Il vettore viene quindi co-transfettato in cellule d’insetto contenenti un genoma virale 
: linearizzato con un enzima di restrizione (RE) che può tagliare in diverse posizioni. La ricombina- 
zione omologa tra il genoma lineare ed il vettore produrrà la formazione di un genoma virale funzio- 
nale in grado di produrre particelle virali. L'inclusione di /acZ nel vettore di trasferimento permette lo 
screening visivo delle placche virali per l’identificazione dei ricombinanti. 
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espressi da un singolo virus. Questo rende possibile la produzione di complessi 
proteici i cui componenti individuali non risultano stabili se espressi singolarmente 
(Roy et al., 1997). Lo svantaggio principale della produzione di proteine con que- 
sto sistema è che la costruzione e la purificazione di vettori ricombinanti di baculo- 
virus per l’espressione di geni target in cellule d’insetto può richiedere da 4 a 6 set- 
timane, e che le cellule crescono lentamente (aumentando il rischio di contamina- 
zione) in terreni piuttosto costosi. Un approccio alternativo per la produzione di 
genomi virali ricombinanti utilizza la trasposizione sito specifica in E. coli piutto- 
sto che la ricombinazione omologa in cellule d’insetto (Luckow et al., 1993). Que- 
sta è basata sulla trasposizione sito-specifica di una cassetta d'espressione in un 
vettore “shuttle” di baculovirus (bacmide) che viene propagato in E. coli. Il bac- 
mide contiene l’intero genoma di baculovirus, un’origine di replicazione del pla- 
smide F di E. coli a basso numero di copie, e il sito d'attacco per il trasposone bat- 
terico Tn7. Il bacmide si propaga in E. coli come un grosso plasmide. I bacmidi ri- 
combinanti vengono costruiti mediante la trasposizione di un elemento Tn7 da un 
plasmide donatore, che contiene il gene target che deve essere espresso, al sito di 
attacco sul bacmide, un plasmide accessorio che codifica la trasposasi necessaria 
per questa funzione. Il bacmide ricombinante può essere isolato da E. coli e trasfet- 
tato direttamente nelle cellule d’insetto. 


8.4 Espressione in cellule di eucarioti superiori 


Le cellule di mammifero presentano degli ovvi vantaggi per la produzione di pro- 
teine di mammifero. Il problema principale per l’espressione di proteine in tali cel- 
lule consiste nel fatto che, almeno sino ad oggi, non è possibile ottenere livelli 
d’espressione simili a quelli raggiunti nei sistemi sopra descritti. Per molti anni la 
produzione di proteine in cellule di mammifero ha utilizzato promotori costitutivi 
forti per indurre la trascrizione del gene target. I promotori, come quelli derivati dal 
promotore precoce di SV40, il promotore di lunghe sequenze terminali (LTR) ripe- 
tute del virus del sarcoma di Rous (RSV), e il promotore precoce immediato del ci- 
tomegalovirus, guidano tutti costitutivamente l’espressione di geni posti sotto il loro 
controllo (Mulligan e Berg, 1981; Gorman et al., 1982; Boshrart et al., 1985). Tutta- 
via, possono anche essere utilizzati sistemi inducibili. Per esempio, i promotori di 
geni indotti da heat-shock o sistemi inducibili dall’ormone glucocorticoide sono stati 
utilizzati per l’espressione di geni target (Wurn, Gwinn e Kingston, 1986: Hirt et al., 
1992). Questi sistemi, tuttavia, hanno il problema dell’espressione basale in assenza 
d’induzione e di condizioni d’induzione potenzialmente dannose. Per superare al- 
cuni dei problemi legati all’utilizzo di promotori endogeni per guidare l’espressione 
genica, sono stati importati in cellule di mammifero alcuni sistemi batterici. 
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8.4.1 Sistema Tet-on/Tet-off 


Come già discusso nel Capitolo 1, il controllo dell’inizio della trascrizione è fonda- 
mentalmente differente tra eucarioti e procarioti. Un attivatore procariotico è inca- 
pace di produrre una risposta trascrizionale in eucarioti, e viceversa. Il legame al 
DNA è, tuttavia, specie indipendente. Il legame al DNA di attivatori procariotici è 
strettamente regolato e tale proprietà può essere utilizzata per dirigere domini di at- 
tivazione eucariotici e guidare l’espressione di geni target. Uno di questi sistemi 
sfrutta le proprietà di legame al DNA del repressore della tetraciclina di E. coli. 
L’operone ter di E. coli è stato originariamente identificato come un trasposone 
(Tn10) in grado di conferire la resistenza all’antibiotico tetraciclina (Foster et al., 
1981). La proteina TetR, in modo simile alla proteina del repressore /ac (Lacl) pre- 
cedentemente discussa (Capitolo 1), si lega all'operatore dell’operone della resi- 
stenza alla tetraciclina e impedisce alla RNA polimerasi d’iniziare la trascrizione. 
L'attivazione dell’operone della resistenza alla tetraciclina si verifica quando la 
stessa tetraciclina lega il repressore ed induce un cambiamento conformazionale che 
inibisce la sua abilità di legare il DNA. La proteina TetR ha una elevata affinità per 
l’antibiotico (costante di associazione: -3 x 107° M) e si dissocierà da suo sito di 
legame al DNA quando la tetraciclina è presente a bassa concentrazione (Takahashi, 
Degenkolb e Hillen, 1991). L'attività regolata di legame al DNA di TetR non può 
essa stessa indurre una risposta trascrizionale negli eucarioti, ma questo accade se la 
proteina viene fusa ad un dominio eucariotico di attivazione trascrizionale. L’uti- 
lizzo del sistema fet per guidare l’espressione genica negli eucarioti si basa sull’in- 
serzione di due molecole di DNA ricombinante nella cellula ospite (Fig. 8.7). 


* Plasmide regolatore — produce una versione del repressore alla tetraciclina di 
E. coli (TetR) che è fusa con un dominio d’attivazione trascrizionale della pro- 
teina VP16 del virus dell’herpes simplex. La proteina di fusione viene prodotta 
costitutivamente nella cellula ospite dal promotore CMV. 


* Plasmide responsivo — contiene il gene target clonato a valle di copie multimeri- 
che della sequenza di DNA dell’operatore della tetraciclina (fetO) che forma un 
elemento che risponde alla tetraciclina (TRE) clonato in un promotore minimo di 
CMV che non è, di per se stesso, capace di guidare l’attivazione genica. 


In assenza di tetraciclina, la proteina di fusione TetR-VP16 si legherà al TRE e at- 
tiverà la trascrizione del gene target. Tuttavia, a seguito dell’aggiunta di tetraciclina 
alle cellule, TetR si dissocierà e la trascrizione del gene target verrà bloccata (Gos- 
sen e Bujard, 1992). Cioè, l’aggiunta di tetraciclina spegne l’espressione del gene 
target. L'uso del sistema tet si è ulteriormente diffuso per l’esistenza di una ver- 
sione mutante di TetR. Il repressore mutante della tetraciclina contiene quattro 
cambiamenti aminoacidici (E71K, D95N, L101S, G102D) rispetto alla proteina 
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Figura 8.7. Espressione genica regolata da tetraciclina per la produzione di proteine in cellule di 
mammifero. | sistemi Tet-off e Tet-on differiscono per la risposta trascrizionale all’aggiunta di tetraci- 
clina. Il sistema Tet-off spegne la trascrizione del gene target in risposta alla tetraciclina, mentre il 
sistema Tet-on che contiene una versione mutante di TetR con differenti proprietà di legame al DNA, 
attiva l’espressione genica in risposta all'aggiunta di tetraciclina. 


wild-type che altera radicalmente le sue proprietà di legame. La proteina mutata, 
denominata rTetR da “reverse Tetracycline repressor”, piuttosto che inibire le sue 
proprietà di legame al DNA in presenza di tetraciclina, si legherà al DNA solo in 
presenza di tetraciclina (Gossen et a/., 1995). Questo significa che, con una fusione 
appropriata di TetR al dominio d’attivazione di VP16, l’espressione del gene target 
può essere o attivata o repressa in presenza di tetraciclina. 


* Tet-off utilizza la proteina TetR wild-type fusa a VP16. L'espressione del gene 
target è attiva in assenza, ma non in presenza, di tetraciclina. 


e Tet-on utilizza la proteina mutante rTetR fusa a VP16. L'espressione del gene tar- 
get è attiva in presenza, ma non in assenza, di tetraciclina. 
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Il vantaggio di questo sistema di accensione e spegnimento sta nel fatto che non è 
necessario che la cellula ospite sia esposta per lungo tempo all’antibiotico prima 
dell’induzione dell’espressione o del silenziamento del gene. Inoltre, il controllo 
sull’espressione del gene target ottenuto dal sistema Tet è strettamente regolato. Ad 
esempio, sono stati prodotti topi transgenici che portano il gene A della tossina dif- 
terica sotto il controllo del promotore TRE. Piccole quantità di tossina, forse per- 
sino una singola molecola, possono portare a morte cellulare. Se nutriti con acqua 
contenente tetraciclina, i topi con la versione Tet-off del regolatore, insieme con il 
sistema sensibile alla tossina difterica, sono in buona salute fino a quando non 
viene rimossa la tetraciclina, dopo di che i topi muoiono in seguito alla produzione 
di tossina (Lee et al., 1998). 


8.5 Purificazione delle proteine 


Le tecniche precedentemente descritte forniscono dei meccanismi attraverso i quali 
una sequenza genica può essere efficacemente convertita nella sequenza polipepti- 
dica codificata. Il problema successivo che il ricercatore deve affrontare è come se- 
parare la proteina target dalle migliaia di proteine naturalmente presenti nell’ospite. 
Molte proteine condividono le medesime proprietà. La denaturazione irreversibile 
delle proteine delle cellule di £. coli e la loro separazione mediante elettroforesi su 
gel bidimensionale ad alta risoluzione, in cui la separazione viene effettuata sia 
sulla base della carica che del peso molecolare, rivela un gran numero di spot che 
corrispondono a proteine individuali (Fig. 8.8). Questa analisi mostra che molte 
proteine sono di medie dimensioni (nell’intervallo di 40-80 kDa) e hanno una ca- 
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Figura 8.8. La separazione di proteine ad alta risoluzione mediante SDS-PAGE bidimensionale. 
L'immagine del gel è stata gentilmente fornita da Phil Cash (University of Aberdeen). 
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rica media (punto isoelettrico compreso tra pH 6 e pH 8). Le tecniche di separa- 
zione nativa sono richieste per l’analisi di proteine funzionali. Tecniche biochimi- 
che tradizionali di separazione possono essere impiegate, come la separazione di 
proteine basata sulle loro dimensioni (cromatografia per gel-filtrazione), sulla loro 
carica (cromatografia a scambio ionico), o sul loro grado di idrofobicità (cromato- 
grafia ad interazione idrofobica), ma la capacità di queste tecniche nel separare pro- 
teine con caratteristiche simili è estremamente limitata. Di conseguenza, le proteine 
ricombinanti possono spesso risultare difficili da purificare e possono richiedere 
molto tempo e numerosi passaggi cromatografici prima di ottenere un grado di puri- 
ficazione accettabile. Naturalmente, il livello di purificazione richiesto dipende dal- 
l’uso che si deve fare della proteina stessa. Molte reazioni enzimatiche hanno luogo 
in lisati cellulari grezzi senza la necessità della purificazione di proteine. Al contra- 
rio, altri metodi, particolarmente quelli di biologia strutturale, richiedono un elevato 
grado di purezza delle proteine. Se la proteina target avesse una proprietà unica, al- 
lora questa proprietà potrebbe essere utilizzata per separarla dalle altre proteine del- 
l’ospite. Le etichette (dette anche tag) per la purificazione delle proteine sono brevi 
sequenze aminoacidiche che possiedono elevata affinità di legame per particolari 
molecole, e il tag fa sì che la proteina target si leghi ad un supporto solido, normal- 
mente fornito dalla matrice di una colonna, a cui poche altre proteine (o nessuna) 
sono in grado di legarsi. La purificazione della proteina così etichettata rispetto alle 
altre proteine della cellula ospite avviene in quattro fasi: lisi della cellula, legame 
della proteina etichettata ad una colonna di affinità, lavaggio della colonna per ri- 
muovere le proteine non etichettate, e finalmente eluizione della proteina etichettata. 
Idealmente, il tag dovrebbe consentire alla proteina ricombinante di legarsi alla co- 
lonna con elevata affinità e specificità, e tale legame dovrebbe essere reversibile in 
condizioni non troppo drastiche in modo da evitare la denaturazione della proteina 
durante il processo di eluizione. Infine, il tag non dovrebbe interferire con la nor- 
male funzione della proteina ricombinante. Di seguito sono descritti alcuni dei più 
diffusi tag di purificazione, mentre altri sono elencati in Tabella 8.1. 


8.5.1 Il tag di istidina 


Il più semplice tra tutti i possibili tag per la purificazione, il tag di istidina o his- 
tag, è normalmente costituito da sei residui di istidina. Il DNA codificante per 
questi residui è clonato nel gene target in modo che il prodotto proteico contenga, 
in una certa posizione della catena polipetidica, sei residui consecutivi di istidina 
(Hoffman e Roeder, 1991). Il clonaggio viene spesso realizzato in modo che tale 
tag sia localizzato alle estremità amino- o carbossi-terminale della proteina, dove è 
meno probabile che interferisca con la sua funzione. Il tag può, tuttavia, anche es- 


sere localizzato al centro di una proteina se è noto che la sua regione centrale non è 


Tag Sequenza $ 


FLAG DYKDDDDK 


S-tag  KETAAAKFER QHMDS 


Trx 109 aminoacidi della 
proteina tioredoxina 


NusA 495 aminoacidi del fattore 
di allungamento 
trascrizionale 


HA YPYDVPDYA 


Myc EQKLISEEDL 


Tabella 8.1. Altri tag proteici utilizzati comunemente 


Fonte 


Peptide leader 
del gene 10 del 
batteriofago T7 


Ribonucleasi 
pancreatica A 
bovina digerita 
con subtisilina 


Gene trxA di 
E. coli 


Gene nusA di 
E. coli 


Emoagglutinina 
dell’influenza 


Proteina c-myc 
umana 


Usi 


Purificazione, western 
blot 


Purificazione, western 
blot 


Aumenta la stabilità 
dei partner di fusione 


Aumenta la stabilità 
dei partner di fusione 


Western blot 


Western blot 


Note 


Disponibili anticorpi 
ad alta affinità 


Si lega con elevata 
affinità alla proteina 
ribonucleasi S 


Può stabilizzare alcune 


proteine, e facilitare 
il ripiegamento 
tridimensionale 

di altre 


Proteina altamente 


solubile che conferisce 
solubilità alle proteine 


di fusione 
Disponibili anticorpi 
ad alta affinità 
Disponibili anticorpi 
ad alta affinità 


Referenze 


(Einhauer e 
Jungbauer, 2001) 


(Raines er al., 2000) 


(La Vallie et al., 
1993a) 


(Davis et al., 1999) 


(Wilson et al., 1984) 


(Evan et al., 1985) 
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Figura 8.9. Il legame di proteine etichettate con residui multipli di istidina ad una resina NTA-Ni**. 


essenziale per la funzione (vedi ad es. Zenke er a/., 1996). Le istidine potranno es- 
sere legate non covalentemente e con alta affinità a certi ioni metallici (Fig. 8.9). In 
una tecnica denominata cromatografia per affinità a ioni metallici immobilizzati 
(IMAC), gli ioni metallici, ad esempio nichel, vengono legati alla matrice di una 
resina e utilizzati per catturare proteine con il tag di istidina (Yip e Hutchens, 
1996). Le resine più comunemente utilizzate a questo scopo contengono legato co- 
valentemente acido nitriloacetico (NTA). NTA ha quattro siti di coordinazione che 
legano strettamente un singolo ione nichel. Due dei sei siti di coordinazione del 
Ni°* restano liberi dopo il suo legame a NTA. In soluzione, questi interagiranno 
debolmente con l’acqua, ma potranno interagire più strettamente con gli anelli imi- 
dazolici delle catene laterali dei residui consecutivi di istidina presenti nella catena 
polipeptidica. Almeno sei residui di istidina sono necessari per realizzare l'affinità 
di legame necessaria per intrappolare fermamente nella colonna le proteine conte- 
nenti il tag. La grande maggioranza delle proteine dell’ospite non sarà in grado di 
legarsi ad una colonna di questo tipo. 

La purificazione di una proteina contenente un tag di istidina da cellule di E. 
coli è mostrata in Fig. 8.10. Cellule di E. coli contenenti un vettore d’espressione 
inducibile vengono cresciute e indotte per produrre la proteina target dotata di tag. 
Le cellule vengono rotte e i residui cellulari insolubili rimossi tramite centrifuga- 
zione. Il sopranatante risultante da questo processo viene applicato ad una colonna 
di NTA-Ni?*. La colonna viene lavata con una soluzione a bassa concentrazione 
d’imidazolo (20 mM) che, competendo con le interazioni a bassa affinità tra pro- 
teine magari ricche in istidina e la colonna d’affinità, rimuove ogni proteina che 
non sia legata in modo specifico. Infine, la proteina con l’his-tag viene eluita dalla 
colonna aumentando drasticamente la concentrazione d’imidazolo (250 mM). Que- 
sto processo produce la purificazione in un singolo passaggio della proteina eti- 
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Figura 8.10. La purificazione di una proteina con his-tag. Sono mostrate la struttura chimica dell’isti- 
dina e dell'anello imidazolico, con il gel di poliacrilammide-SDS utilizzato per la purificazione di una 
proteina con his-tag. Un estratto cellulare di E. coli che produce una proteina di 14 kDa con his-tag 
viene applicato ad una colonna di NTA-Ni?*. La colonna viene lavata con un tampone contenente 
una bassa concentrazione di imidazolo (20 mM) omologo dell’istidina, prima dell’eluizione della pro- 
teina con his-tag mediante un gradiente di imidazolo (20-250 mM). Le proteine sono visualizzate sul 
gel mediante colorazione con blue Comassie. 


chettata, per ottenerne un campione estremamente puro ed omogeneo. Le proteine 
con his-tag, ottenute da vari sistemi di espressione inclusi i batteri, il lievito, il ba- 
culovirus e le cellule di mammifero, possono essere purificate fino ad un elevato li- 
vello di omogeneità mediante questa tecnica. Possono anche essere utilizzate con- 
dizioni alternative di eluizione. Per esempio, abbassando il pH da 8 a 4.5, si altera 
lo stato di protonazione dei residui d’istidina con il risultato di ottenere la dissocia- 
zione della proteina dal complesso metallico. La proteina etichettata può anche es- 
sere eluita mediante aggiunta di agenti chelanti, come l’EDTA, per strappare gli 
ioni nichel dalla colonna e rimuovere di conseguenza la proteina etichettata. 

Le piccole dimensioni del tag d’istidina fanno sì che la proteina ricombinante 
etichettata si comporti in modo pressoché identico alla corrispondente proteina na- 
tiva. In alcuni casi, si è osservato che la proteina etichettata è anche biologicamente 
più attiva della corrispondente versione nativa della stessa proteina (Janknecht et al., 
1991). Tuttavia, questo effetto è probabilmente dovuto alla rapidità del processo di 
purificazione piuttosto che ad una effettiva attività biologica dello stesso tag. Al- 
cune proteine sono state cristallizzate in presenza dell’his-tag (Kim et al., 19962). 
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Inoltre, l’his-tag ha proprietà immunogeniche molto ridotte e di conseguenza la 
proteina ricombinante contenente il tag può essere utilizzata per produrre anticorpi. 
In alcuni casi è stato riportato che l’his-tag alteri la funzione della proteina (vedi 
per es. Knapp et al., 2000) ma, come si vedrà in seguito, è più importante rimuo- 
vere tag di tipo diverso. Un ulteriore vantaggio dell’his-tag è che la purificazione 
può essere effettuata in condizioni denaturanti (Reece, Rikles e Ptashne, 1993). 
L’interazione tra i residui di istidina e gli ioni metallici non richiedono alcuna spe- 
cifica struttura proteica e può aver luogo anche in presenza di denaturanti proteici 
molti forti (es. urea $8M). Questo è particolarmente importante quando si debbano 
purificare proteine che diversamente sarebbero insolubili. 


8.5.2 Il tag GST 


Le glutatione-S-transferasi (GSTs) sono una famiglia di enzimi coinvolti nella di- 
fesa cellulare contro composti chimici xenobiotici elettrofilici. Esse catalizzano 
l’addizione di glutatione ai substrati elettrofilici, aumentandone la solubilità in ac- 
qua e promuovendone la successiva degradazione enzimatica (Strange, Jones e 
Fryer, 2000). Il glutatione è un tripeptide costituito dagli aminoacidi: acido glutam- 
mico, cisteina e glicina (Fig. 8.11(a)). Il GST si lega al glutatione con elevata affi- 
nità (Fig. 8.11 (b)). 

L’enzima del platelminta parassita Schistosoma japonicum è una proteina di- 
merica di 26 kDa (Walzer et al., 1993). Il gene che codifica per questa proteina 
può essere fuso, nel modulo di lettura corretto al gene target per far produrre da un 
vettore di espressione una proteina di fusione. Le cellule ospite che producono la 
proteina di fusione vengono lisate e le proteine solubili sono applicate ad una co- 
lonna cui è legato il glutatione (es. glutatione-agarosio). L'interazione specifica tra 
GST e glutatione produrrà il legame della proteina di fusione alla colonna, mentre 
la maggior parte delle proteine dell’ospite non saranno in grado di legarsi. La pro- 
teina legata può quindi essere eluita dalla colonna mediante un lavaggio con gluta- 
tione a concentrazione elevata (10 mM) in modo da competere con le interazioni 
presenti sulla colonna (Fig. 8.11 (c)). 

Sia le grandi dimensioni del GST che la sua natura dimerica implicano che il tag 
avrà una maggiore probabilità di alterare l’attività biologica della proteina target ri- 
spetto all’his-tag. È quindi desiderabile rimuovere la porzione di GST della proteina 
di fusione per studiare l’attività della proteina target isolata. Questo risultato si può 
ottenere con l’inclusione, nel vettore di espressione, di una sequenza di DNA codifi- 
cante per la sequenza aminoacidica specifica per il sito di taglio di una proteasi tra il 
GST e il gene target. Il trattamento della proteina di fusione purificata con la proteasi 
porterà alla formazione di due polipeptidi, la proteina target libera e lo stesso GST. Il 
GST può quindi essere separato dalla proteina target riapplicando la miscela alla co- 
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Figura 8.11. La purificazione delle proteine marcate con GST. (a) La struttura chimica del tripeptide 
glutatione e l’azione del GST in seguito all'aggiunta a composti elettrofilici (R). Il glutatione è costi- 
tuito da tre aminoacidi — acido glutammico, cisteina e glicina. Nota che l'acido glutammico si lega al 
dipeptide Cys-Gly per mezzo del suo gruppo y-carbossilico. (b) La struttura tridimensionale del com- 
plesso GST-glutatione. La proteina è schematizzata con il modello a nastro e il glutatione con il mo- 
dello a bastoncini di colore verde (Garcia-Saez et al., 1994). (c) La purificazione di una proteina con 
tag GST da cellule di E. coli. La proteina con tag viene legata ad una colonna per affinità per il gluta- 
tione ed eluita utilizzando lo stesso glutatione libero. La proteina con tag è indicata dalla freccia. 


lonna di glutatione. Il GST, ma non la proteina target, si legherà nuovamente alla co- 
lonna. Le frazioni raccolte dalla colonna conterranno la proteina target purificata. 

Una varietà di proteasi specifiche è stata utilizzata per rimuovere i tag di purifi- 
cazione dalle proteine target di fusione (Tabella 8.2). A differenza degli enzimi di 
restrizione quando tagliano il DNA (vedi Capitolo 2), molte proteasi non hanno 
una preferenza assoluta per una specifica sequenza aminoacidica per effettuare il 
loro taglio. Ad esempio, il fattore proteasico Xa taglia dopo un residuo di arginina 
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Tabella 8.2. Proteasi sito-specifiche. La sequenza di riconoscimento di ciascuna proteasi 
viene mostrata con il reale sito di taglio, indicato dalla freccia 


Proteasi Sito di riconoscimento Note Referenza 
e di taglio 
Fattore Xa HeGluGlyArgl Proteina di 42 kDa costituita . (Nagai, Perutz e 
da due catene legate da Poyart, 1985) 


ponti disolfuro, purificata 
da plasma bovino 
Enterochinasi AspAspAspAspLyst Catena leggera di 26 kDa (LaVallie et al., 
della enterochinasi 1993b) 
bovina prodotta e 
‘. purificata da E. coli 


Trombina LeuValProArglGlySer Purificata da plasma bovino (Chang, 1985) 

TEV GluAsnLeuTyrPheGInLGly Proteasi del virus etch (Dougherrry et al., 
del tabacco 1989) 

PreScission LeuGluValLeuPheGIntGlyPro Proteasi dal rinovirus (Walker et al., 
umano 3C 1994) 


preferibilmente collocato nella sequenza di riconoscimento Ile-Glu-Gly-Arg. Tutta- 
via, qualche volta agirà anche su altri residui basici, in funzione della conforma- 
zione del substrato proteico. Vari siti secondari riconosciuti dalla proteasi sono stati 
sequenziati e contengono il sito di taglio dopo il dipeptide Gly-Arg (Quinlan, Moir 
e Stewart, 1989). Di conseguenza la proteasi può tagliare non solo il sito tra il tag e 
la proteina target, ma anche la stessa proteina target ed è ovviamente importante 
che questo sia evitato. Altre proteasi, come TEV e PreScission, hanno siti di rico- 
noscimento più grandi e specifici e avranno minore probabilità di effettuare tagli 
aspecifici in siti alternativi. La proteasi TEV ha l’ulteriore vantaggio che la pro- 
teasi può essere prodotta in forma ricombinante da £. coli e quindi non risulta con- 
taminata da altri fattori o proteasi. 


8.5.3 Il tag MBP 


Il gene target viene inserito a valle del gene mal£ di E. coli, che codifica per la pro- 
teina che lega il maltosio (MBP), in un vettore d’espressione in grado di produrre la 
proteina di fusione con MBP (Kellerman e Ferenci, 1982). Il maltosio è un disacca- 
ride costituito da due molecole di glucosio (Fig. 8.12 (a)). MPB è una proteina mo- 
nomerica di 40 kDa che forma parte del sistema maltosio/maltodestrina di £. coli, 
che è responsabile dell’assorbimento e dell’efficienza del catabolismo dei polimeri 
del glucosio (Boos e Shuman, 1998). La proteina subisce un profondo cambiamento 
conformazionale in seguito al legame con il maltosio, formando un complesso 
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Figura 8.12. La purificazione delle proteine etichettate con MBP. (a) la struttura chimica del maltosio, 
un disaccaride del glucosio. (b) La struttura tridimensionale del complesso MBP-maltosio (Quiocho, 
Spurlino e Rodseth, 1997). La proteina è rappresentata con il modello a nastri con le -eliche colo- 
rate in porpora e i foglietti-B in blu. Il maltosio è mostrato con un modello a bastoncini verdi. (c) La 
purificazione di una proteina con MBP-tag. La proteina con il tag viene legata in una colonna di ami- 
losio ed eluita con maltosio. La fusione MBP-target viene quindi tagliata da una proteasi in corrispon- 
denza del sito indicato dalla X, e riapplicata sulla colonna di amilosio. La proteina target non si le- 
gherà alla colonna una volta separata dalla porzione MBP. L'immagine del gel è ristampata con il per- 
messo di New England Biolabs, © 2002/2003. 


molto stabile (Fig. 8.12 (b)). La purificazione, in un singolo passaggio, delle pro- 
teine di fusione può essere ottenuta utilizzando l’affinità di MBP per l’amilosio con 
legami crociati (amido) (di Guan et al. 1988). Le proteine legate possono essere 
eluite dall’amilosio aggiungendo il maltosio (10 mM) nel tampone della colonna 
(Fig. 8.12 (c)). 
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8.5.4 IMPACT 


La purificazione mediata da inteina con un tag di affinità per il legame alla chitina 
(IMPACT, Intein Mediated Purification with an Affinity Chitin binding Tag) rap- 
presenta un approccio per la purificazione delle proteine che utilizza l’auto-spli- 
cing delle inteine per rimuovere il tag di purificazione e produce proteina isolata 
purificata in un unico passaggio cromatografico. Le inteine sono una classe di pro- 
teine, presenti in un’ampia varietà di organismi, che si formano ritagliandosi dal- 
l’interno di una proteina precursore, in un processo in cui vengono legate le por- 
zioni esterne fiancheggianti (exteine) (Cooper e Stevens, 1995). L’inteina rimossa è 
una DNA endonucleasi sito specifica che catalizza la mobilità genetica della pro- 
pria sequenza codificante. Il processo di taglio e ligazione del polipeptide è dipen- 
dente da una specifica chimica dei gruppi tiolici che coinvolge i tioli e un residuo 
di asparagina conservato. 

La maggior parte delle inteine ha un residuo di cisteina all'estremità amino-ter- 
minale e una asparagina all’estremità carbossi-terminale (Fig. 8.13 (a)). Tutta 
l'informazione necessaria per lo splicing è contenuta nell’inteina stessa, e se queste 
sequenze sono inserite nel contesto di una proteina target, esse saranno ugualmente 
rimosse. Il meccanismo dello splicing è complesso, ma la reazione è molto effi- 
ciente. Il sistema d’espressione IMPACT si fonda su questa chimica insolita, utiliz- 
zando la mutazione dell’asparagina C-terminale in alanina in una inteina di lievito, 
VMAI (Chong e Xu, 1997). Questa reazione impedisce la reazione che taglia all’e- 
stremità C-terminale dell’inteina e intrappola la proteina in un tioestere che può es- 
sere scisso da B-mercaptoetanolo o ditiotreitolo (DTT). Il gene target viene clonato 
in un vettore d’espressione in modo che venga prodotta una proteina di fusione a tre 
componenti, in cui si realizza una fusione dei domini di legame della proteina tar- 
get, inteina e chitina. La chitina è un polisaccaride fibroso insolubile costituito da 
B-1,4-N-acetyl-D-glucosamina che si trova nella parete cellulare di funghi ed alghe 
e nell’esoscheletro degli artropodi. La chitinasi catalizza la degradazione idrolitica 
della chitina, e l'enzima del Bacillus circulans (Mr 74 kDa) contiene tre domini, un 
dominio catalitico amino-terminale (CatD) (417 amino acidi), una ripetizione in 
tandem di domini della fibronectina di tipo III (FnIII) (95 residui duplicati) e un do- 
minio carbossi-terminale in grado di legare la chitina (CBD, 45 amino acidi) (Wata- 
nabe et al., 1990). Il CBD isolato mostra elevata affinità por la chitina. 

Nel sistema IMPACT, la proteina di fusione viene fatta in E. coli e passata attra- 
verso la colonna di chitina, dove si lega. La proteina può essere staccata dalla co- 
lonna usando composti tiolici, come il DTT a 4°C. Questo è un processo lento che 
richiede una incubazione overnight per essere completato, e può diventare problema- 
tico se la proteina target non è stabile in queste condizioni. La proteina target finale 
prodotta con questo metodo è quella nativa con l’eccezione del gruppo tioestere le- 
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Figura 8.13. Il sistema IMPACT per la purificazione della proteina dotata di tag e la successiva 
rimozione del tag. (a) La normale reazione di splicing comporta la completa rimozione dell’inteina 
e la riunione delle sequenze polipeptidiche poste alle sue estremità amino- e carbossi- terminali. 
(b) Una forma mutante dell’inteina in cui un’asparagina essenziale è sostituita da un’alanina porta ad 
una rottura parziale e al rilascio del solo peptide amino-terminale. (c) La chimica della reazione di 
splicing utilizzata per rimuovere dalla proteina target il tag costituito da inteina-CBD (chitin-binding 
domain). (d) La purificazione della metilasi Hhal ottenuta con il sistema IMPACT (Chong et al., 1997). 
La proteina target modificata viene eluita dalla colonna, mentre il detergente SDS viene utilizzato per 
la rimozione della fusione inteina-CBD. L'immagine del gel è stata gentilmente concessa da Ming- 
Qun Xu (New England Biolabs). 
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gato alla sua estremità carbossi-terminale. Il tioestere è tuttavia instabile e si idroliz- 
zerà spontaneamente per dare la proteina nativa. Altri tioli possono essere utilizzati 
per avviare il processo di rottura, come il B-mercaptoetanolo e la cisteina. La rottura 
indotta da cisteina porta all’inserimento di un residuo di cisteina all'estremità car- 
bossi-terminale del peptide che viene escisso. La cisteina può essere marcata radioat- 
tivamente, o può essere un sito soggetto a modificazione chimica, specialmente nel 
caso in cui sia l’unica cisteina presente nella proteina. Infatti, essa è un buon sito per 
l’attacco di cross-ligandi, marcatori fluorescenti, marcatori di spin o altri tag. 


8.5.5 TAP tagging 


Un’estensione dei metodi per la sovra-produzione di proteine etichettate consiste nel- 
l’aggiunta di un tag a proteine prodotte a livelli wild-type nella cellula ospite. In que- 
ste circostanze, la purificazione della proteina etichettata, se condotta in appropriate 
condizioni, può portare all’isolamento d’interi complessi proteici naturalmente pre- 
senti nella cellula. La maggior parte delle proteine non è, infatti, presente in cellula 
come un’entità singola; esse sono associate, mediante interazioni non covalenti, ad 
una varietà di altre proteine che possono avere un ruolo nella regolazione della loro 
funzione. La sovra-produzione di una singola proteina non porterà alla sovra-produ- 
zione delle altre proteine del complesso per cui, per isolare i complessi proteici delle 
cellule, la produzione della proteina deve essere nelle condizioni più simili possibile 
a quelle naturali. Il DNA codificante per un tipo di tag denominato “tandem affinity 
purification” (TAP) viene clonato al 3’ di un gene target in modo che non venga alte- 
rata la sua trascrizione, e la proteina di fusione viene prodotta agli stessi livelli della 
proteina wild-type. Il TAP tag codifica per due elementi di purificazione, un pepdide 
in grado di legare la calmodulina e la proteina A di Staphylococcus aureus. Questi 
elementi sono separati da un sito di taglio per la proteasi TEV (Puig et al., 2001). Le 
cellule contenenti la proteina etichettata vengono lisate in condizioni blande e quindi 
applicate ad una colonna contenente IgG, che si lega con elevata affinità alla proteina 
A. La proteina di fusione, e le proteine ad essa associate, vengono rimosse dalla co- 
lonna mediante la proteasi TEV e applicate direttamente ad una colonna contenente 
calmodulina, in presenza di Ca?*, e quindi eluite usando l’agente chelante EDTA. La 
procedura di purificazione in due fasi è altamente specifica e può portare all’isola- 
mento di complessi proteici privi di contaminanti. Il TAP tag consente la purifica- 
zione rapida di complessi proteici da un numero relativamente piccolo di cellule 
senza la necessità di conoscere a priori la composizione, l’attività o la funzione del 
complesso stesso (Rigaur et a/., 1999; Gavin et al., 2002) e, in combinazione con la 
spettrometria di massa, la strategia TAP consente l’identificazione delle proteine che 
interagiscono in vivo con una data proteina target. 


Progetti di sequenziamento 
genomico 


Concetti chiave 


+ Le mappe genetiche e fisiche sono utilizzate per determinare l’ordine 
dei geni su un cromosoma e la loro distanza approssimata 


#+ La determinazione della sequenza di DNA è condotta impiegando 
dideossinucleotidi che bloccano la replicazione in corrispondenza di 
una specifica base. | frammenti di DNA che differiscono di una 
singola base possono essere separati su un gel di poliacrilamide 


+ Le reazioni di sequenza generano sequenze di alcune centinaia di 
basi 


+ Interi genomi possono essere sequenziati clonando casualmente 
piccoli frammenti di DNA genomico, determinandone la sequenza e, 
successivamente, riassemblando la sequenza genomica basandosi 
sulle sovrapposizioni tra i frammenti sequenziati 


* Grandi potenze di calcolo sono richieste per assemblare i frammenti 
sequenziati e determinare la posizione dei geni all’interno del genoma 


L'obiettivo finale di tutti i progetti di sequenziamento genomico è la determina- 
zione precisa della sequenza di basi che costituisce ogni molecola di DNA di un 
genoma. La conoscenza della sequenza dei singoli geni e dell’intero genoma, è di 
vitale importanza se vogliamo comprendere, non solo il funzionamento dei geni e 
delle proteine, ma anche come differenti prodotti genici influenzano l’attività di 
tutti gli altri nel contesto dell’intero organismo. La mera quantità del DNA conte- 
nuto nel genoma di un organismo rappresenta, di per sé, un ostacolo significativo 
al raggiungimento di questo livello di analisi. Tuttavia, anche se non si dispone 
della conoscenza della sequenza completa, possono essere utilizzati una serie di me- 
todi per mappare la posizione dei geni e di altre sequenze di DNA all’interno del 
genoma. Su scala ridotta, la mappatura di frammenti di DNA è un processo relativa- 
mente diretto (Fig. 9.1). Abbiamo già visto (Capitolo 2) che gli enzimi di restri- 
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Figura 9.1. Mappatura di piccoli frammenti di DNA mediante digestione con enzimi di restrizione. 
(a) Un frammento di DNA da 1.2 kbp isolato dopo la digestione con Pstl viene tagliato con l'enzima 
di restrizione EcoRI, o BamHi, o una miscela di entrambi come indicato. | prodotti vengono separati 
su gel di agarosio e le dimensioni delle bande risultanti calcolate rispetto al riferimento costituito da 
frammenti di DNA di dimensione nota (M). (b) La mappa di restrizione dedotta per il frammento di 
DNA. | siti per Pstl sono posti alle due estremità e la localizzazione dei siti per EcoRI e BamHI può 
essere determinata dalla dimensione dei frammenti ottenuti. 


zione tagliano il DNA in corrispondenza di specifiche sequenze, denominate siti di 
riconoscimento. I siti di taglio possono essere utilizzati come punti di riferimento 
nella mappa per la costruzione di un diagramma lineare dell’ordine secondo cui i siti 
di restrizione si susseguono in una particolare molecola di DNA e la distanza tra cia- 
scun sito, derivata dalla lunghezza dei frammenti prodotti dopo la digestione. Su 
scala genomica, tuttavia, analisi di questo tipo sono estremamente difficili. L'enorme 
numero di frammenti di DNA prodotti dalla digestione con enzimi di restrizione del 
DNA genomico rende praticamente impossibile ordinare i frammenti in questo 
modo. In questo capitolo verranno discussi una serie di metodi fisici e genetici che 
sono stati utilizzati per la mappatura dei genomi. La nostra discussione si concentrerà 
prevalentemente sui progetti di mappatura e sequenziamento associati al genoma 
umano, anche se ovviamente il lettore potrà rendersi conto che la maggior parte del 
bagaglio di conoscenze impiegato per la determinazione della sequenza del genoma 
umano deriva dall’analisi di altri organismi, sia procariotici che eucariotici. 
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9.1 Mappatura genomica 


Negli eucarioti, il modo più semplice, e più naturale, di ridurre un genoma in pic- 
coli frammenti è considerare singolarmente il DNA contenuto in ciascun cromo- 
soma. Dato che ogni cromosoma è costituito di una molecola di DNA a doppio fi- 
lamento, il cromosoma fornisce il primo livello di mappatura del genoma. Il conte- 
nuto cromosomico di un organismo (il suo cariotipo) può essere visualizzato 
usando un microscopio. Ogni cromosoma è costituto da due braccia separate da un 
centromero. Per convenzione il braccio corto di un cromosoma è denominato brac- 
cio p, e quello più lungo braccio q. I differenti cromosomi di un organismo hanno 
normalmente lunghezza differente (comprese nell’uomo tra 279 x 10° bp per il 
cromosoma 1 e 45 x 10° bp per il cromosoma 21), ma la maggior parte dei cromo- 
somi non possono essere distinti al microscopio solo sulla base delle loro dimen- 
sioni. Tuttavia, è possibile ottenere schemi di bandeggio distinti e specifici se i cro- 
mosomi vengono trattati con specifici coloranti. Approssimativamente, si possono 
ottenere in modo riproducibile 500 differenti bande dopo il trattamento dei cromo- 
somi umani con il colorante Giemsa (Fig. 9.2). Questi schemi di bandeggio possono 
essere utilizzati per creare una mappa citologica di ogni cromosoma e fornire un 
meccanismo a bassa risoluzione per distinguere una porzione del cromosoma da 
un’altra. Alcune anormalità cromosomiche che causano malattie genetiche eredita- 
rie possono essere diagnosticate dall’analisi del cariotipo. Infatti, si possono identi- 
ficare copie addizionali dei cromosomi, ad es. la sindrome di Down deriva da una 
copia addizionale (trisomia) di tutto o parte del cromosoma 21, e i pazienti della 
sindrome di Klinefelter possiedono tre cromosomi sessuali (XX.Y). Inoltre, una va- 
rietà di altre anomalie cromosomiche come delezioni, inversioni, traslocazioni, ecc. 
possono essere rilevate come anomalie del normale schema di bandeggio. Lo 
schema del bandeggio fornisce anche un meccanismo per la marcatura di regioni 
cromosomiche. Ad esempio, usando alcune delle tecniche di seguito descritte, il 
gene mutato nei pazienti con fibrosi cistica è stato mappato sul braccio lungo del 
cromosoma 7 nella regione di bandeggio 31. La localizzazione cromosomica del 
gene nella mappa citologica è quindi designata come 7q31. 

Frammenti di DNA isolati possono essere riportati sulla mappa citologica attra- 
verso una varietà di metodi. Per esempio, frammenti di DNA a singolo filamento 
marcati con molecole fluorescenti possono venire ibridati a cromosomi dispersi, 
come quelli mostrati in Figura 9.2, determinando la localizzazione delle sequenze 
complementari (Taanman et al., 1991). Questo metodo di ibridazione fluorescente 
in situ (FISH) è uno strumento potente per localizzare le sequenze di DNA su sin- 
goli cromosomi e perfino su parti di cromosomi, ma è a bassa risoluzione per il 
fatto che sequenze più vicine di circa 3 Mbp mostreranno segnali di ibridazione tra 
loro indistinguibili. Un certo numero di mappe genetiche e fisiche dei cromosomi 
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Figura 9.2. Il cariotipo umano maschile che mostra le bande G. Cromosomi metafasici di un sog- 
getto maschile vengono trattati con la proteasi tripsina (per rimuovere le proteine) e quindi colorate 
con una miscela di coloranti denominata Giemsa (da Gustav Giemsa che li usò per primo) e visualiz- 
zate con un microscopio ottico. Ogni coppia di cromosomi ha una lunghezza simile e uno specifico 
schema di bandeggio, consentendone l’appaiamento. | cromosomi di un soggetto femminile avreb- 
bero due cromosomi X piuttosto che un cromosoma X e un cromosoma Y come qui mostrato. 


sono state prodotte anche per determinare la localizzazione di specifiche sequenze 
di DNA (Fig. 9.3), e queste verranno discusse successivamente. 


9.2 Mappatura genetica 


Una mappa genetica è una rappresentazione della distanza tra due elementi di 
DNA basata sulla frequenza di ricombinazione osservata tra di essi. La prima 
mappa genetica di un cromosoma è stata costruita da Alfred Sturtevant utilizzando 
dati di incroci di Drosophila collezionati da Thomas Morgan (Morgan, 1910). Stur- 
tevant utilizzò la frequenza con cui un particolare fenotipo osservabile veniva sepa- 
rato da altri geni (attraverso eventi di ricombinazione) durante la meiosi. Le infor- 
mazioni ottenute dagli incroci sperimentali poté essere usata per determinare la lo- 
calizzazione dei geni, dato che geni strettamente associati sono fisicamente localiz- 
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Figura 9.3. | differenti tipi di mappatura genetica e fisica di un crosomoma. Le distanze sulla mappa 
genetica sono basate sulle frequenze di crossing over e sono misurate in centiMorgans (cM), mentre 
le distanze fisiche sono misurate in coppie di megabasi (Mbp) o di kilobasi (kbp). 


zati vicini tra loro, mentre quelli che sono solo debolmente associati sono fisica- 
mente distanti. Sturtevant costruì una mappa genetica della localizzazione di sei 
geni sul cromosoma X di Drosophila melanogaster (Sturtevant, 1913). Molti altri 
tratti genetici in una varietà di differenti organismi sono stati mappati usando tecni- 
che simili. Le mappe genetiche possono essere costruite per ogni cromosoma di 
ciascun organismo. I geni collocati su cromosomi diversi non sono associati tra 
loro e quindi non possono essere oggetto di questa analisi. La maggiore limita- 
zione di questo tipo di approccio è la necessità di disporre di un fenotipo per il 
gene che deve essere mappato e il gran numero di incroci richiesti per generare una 
mappa accurata. Inoltre, una tacita assunzione delle mappature basate sugli incroci 
è che la frequenza di ricombinazione sia la stessa lungo tutto il cromosoma. Questo 
semplicemente non accade dato che sono stati identificati molti “punti caldi” (hot- 
spot) e “punti freddi” (cold-spot) di ricombinazione. 

Nell'uomo, la segregazione familiare di alleli mutanti naturali può essere utiliz- 
zata per stimare le distanze di mappa, ma il numero relativamente basso di geni 
umani identificati in precedenza rende questo approccio difficoltoso. Un’alternativa 
all’utilizzo della segregazione di fenotipi per la mappatura genetica è seguire la tra- 
smissione di variazioni di sequenze di DNA tra gli individui. Si stima che più del 
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99% della sequenza del DNA umano sia identica in tutta la popolazione. Tuttavia, 
si può osservare un numero enorme di variazioni nella sequenza di DNA tra gli in- 
dividui. Vari metodi sono stati utilizzati per investigare i meccanismi dell’eredita- 
rietà di queste variazioni e mappare la loro localizzazione genetica. 


* Polimorfismi di un singolo nucleotide. Il tipo più comune di variazione di se- 
quenza tra gli individui è costituito dal polimorfismo di un singolo nucleotide 
(single-nucleotide polymorphism, SNP), in cui si osserva una singola differenza 
di basi tra due diversi individui. Queste differenze possono essere osservate ogni 
circa 100-300 bp (Collins et a/., 1998). Alcune di queste alterazioni possono es- 
sere responsabili dell’insorgenza di malattie: possono, cioè, modificare la se- 
quenza di aminoacidi di una proteina o alterare le modalità d'espressione di un 
gene. Molti SNP, tuttavia, sono localizzati nelle regioni non codificanti del DNA 
o, anche se sono all’interno di regioni codificanti, possono non alterare la se- 
quenza degli aminoacidi a causa della degenerazione del codice genetico. Alcune 
delle differenze nucleotidiche tra individui modificano, tuttavia, le sequenze di 
riconoscimento di enzimi di restrizione in modo che siti pre-esistenti vengono 
eliminati, e nuovi siti sono formati (Fig. 9.4). I cambiamenti delle basi in corri- 
spondenza di questi siti determinano la produzione di frammenti di DNA di lun- 
ghezza differente in seguito alla digestione con i corrispondenti enzimi di restri- 
zione. Questi polimorfismi della lunghezza dei frammenti di restrizione (Restric- 
tion Fragment Length Polymorphism, RFLP) vengono normalmente rilevati me- 
diante Southern blot (Capitolo 2) utilizzando una sonda di DNA marcata radioat- 
tivamente. Gli RFLP sono ereditati e segregano negli incroci, possono quindi es- 
sere mappati mediante l’analisi di linkage proprio come i geni (NIH/CEPH Col- 
laborative Mapping Group, 1992). 


e VNTR. Un altro tipo di variazione piuttosto comune nell’uomo riguarda piccole se- 
quenze di DNA presenti nel genoma in forma di ripetizioni in tandem. Il numero di 
copie di queste ripetizioni in tandem (variable number of tandem repeats, VNTR) 
in una specifica localizzazione genomica è un carattere altamente polimorfico e 
può essere sensibilmente differente negli individui. Le dimensioni dei frammenti di 
restrizione (anche queste determinate mediante Southern blotting) ottenute utiliz- 
zando enzimi che tagliano il DNA in regioni che fiancheggiano le ripetizioni sa- 
ranno variabili a seconda del numero di copie della ripetizione in esso presenti. 


* Microsatelliti. I microsatelliti sono piccole sequenze ripetute in tandem, da 2 a 6 
bp, disperse apparentemente a caso per tutto il genoma degli organismi superiori. 
Essi si trovano generalmente nelle regioni non codificanti del DNA, e la loro fun- 
zione (se ne hanno) è sconosciuta. Il numero di ripetizioni che si osserva in una 
particolare localizzazione genomica è altamente individuo-specifico. Si pensa 
che le ripetizioni siano generate dallo “scivolamento” della polimerasi durante la 
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Figura 9.4. Polimorfismi di lunghezza dei frammenti di restrizione. (a) Una sezione del DNA che 
contiene tre siti di riconoscimento per l'enzima di restrizione EcoRI. Il cambiamento di una singola 
base all’interno di uno di questi siti distrugge la sequenza di riconoscimento. (b) Il taglio del DNA con 
EcoRI genera frammenti di diverse dimensioni in grado di ibridarsi con il frammento mostrato di DNA 
marcato (sonda di ibridazione). Nel primo caso si formano due piccoli frammenti in grado di legarsi 
alla sonda, mentre nel secondo caso si lega un unico frammento più grande. | frammenti di restri- 
zione vengono separati su un gel di agarosio e sottoposti a Southern blotting (Figura 2.21) per l’iden- 
tificazione delle sequenze complementari alla sonda. 


replicazione (Schlotterer, 2000). Nell'uomo, il tipo più comune di microsatellite 
è la sequenza 5--AC-3’ e nel genoma si osservano diverse migliaia di copie di 
questo tipo di microsatellite. I microsatelliti dinucleotidici nei mammiferi hanno 
tipicamente un numero di copie compreso tra 10 e 30. Il DNA di un microsatel- 
lite può essere amplificato mediante PCR con primer localizzati nelle regioni ad 
esso immediatamente fiancheggianti. La dimensione del prodotto di PCR sarà 
quindi dipendente dal numero di copie della ripetizione. I microsatelliti sono ere- 
ditati da una generazione all’altra e possono quindi essere utilizzati per la map- 
patura mediante analisi di linkage (Dib er al., 1996). 


9.3 Mappatura fisica 


L'informazione che deriva dalle mappe genetiche è di vitale importanza per fornire 
indizi circa l'ordine e la distanza approssimata tra particolari sequenze di DNA al- 
l'interno di un cromosoma. La mappa, pur non fornendo alcuna informazione le- 
gata alla sequenza stessa, assegna una struttura su cui collocare le informazioni di 
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sequenza che si potranno ottenere successivamente. La mappa fisica di un genoma 
è data dalla mappa dei marcatori genetici ottenuta analizzando direttamente il 
DNA genomico, piuttosto che analizzando eventi di ricombinazione. Come per le 
mappe genetiche, si può costruire la mappa fisica di ogni singolo cromosoma che 
compone il genoma. Come detto prima, una varietà di tecniche può essere utiliz- 
zata per la costruzione di una mappa fisica in assenza di informazione di sequenza. 


* Mappe di restrizione. La digestione di un DNA genomico, o anche di cromosomi 
isolati, produce un gran numero di frammenti che dopo una corsa elettroforetica 
su gel di agarosio appare come una strisciata continua, piuttosto che sotto forma 
di bande discrete. Tuttavia, certi enzimi di restrizione, come Notl, hanno una se- 
quenza di riconoscimento relativamente estesa (5°-GCGGCCGC-3”) che si trova 
raramente nelle sequenze di DNA umano. Il sito di riconoscimento per Notl si 
troverà sul DNA approssimativamente ogni circa 48 = 65.536 bp. Sulla base di 
osservazioni sperimentali è noto che Notl taglia il DNA, in media, ogni 10 Mbp. 
La discrepanza tra questi due numeri deriva dal fatto che la sequenza di DNA in 
un genoma non è casuale. Ad esempio, la sequenza 5°-CG-3°, si trova molto meno 
frequentemente di quanto ci si potrebbe attendere, e cluster di questi dinucleotidi 
tendono a concentrarsi soltanto alla estremità 5°- dei geni attivamente trascritti 
(Cross e Bird, 1995). La sequenza di riconoscimento per Notl contiene due di 
questi dinucleotidi e ciò spiega perché l’enzima taglia il DNA così infrequente- 
mente. Anche se usiamo enzimi di restrizione con siti di riconoscimento relativa- 
mente rari, la costruzione di mappe di restrizione come quelle generate per piccoli 
frammenti di DNA (Fig. 9.1) risulta estremamente difficoltosa. La mappatura di 
restrizione fornisce stime molto affidabili sulla disposizione dei frammenti e 
sulla loro distanza relativa, ma è stata completata solo per pochi cromosomi 
umani (Ichikawa et al., 1993: Hosoda er al., 1997). 


e Mappe da ibridi di radiazione. Un ibrido da radiazione è normalmente costituito 
da una linea cellulare di criceto che contiene un frammento relativamente piccolo 
del genoma di un altro organismo, ad es. uomo. L’irradiazione con raggi X di cel- 
lule umane provoca rotture casuali nel DNA e produce diversi frammenti. La di- 
mensione dei frammenti prodotti diminuisce con l'aumentare della dose di raggi 
X. I livelli di radiazione utilizzati sono sufficienti per uccidere le cellule umane, 
ma i frammenti cromosomici possono essere recuperati fondendo in vitro le cel- 
lule irradiate con cellule di criceto. Tipicamente i frammenti di DNA nell’ibrido 
avranno la lunghezza di poche megabasi. Il DNA umano all’interno della linea 
cellulare ibrida potrà essere quindi analizzato per identificare i marcatori genetici 
che contiene sia mediante ibridazione che con la PCR. Quanto più vicini saranno 
due marcatori, tanto maggiore sarà la probabilità che essi siano localizzati sullo 
stesso frammento di DNA, e cioè che siano finiti nello stesso ibrido da radiazione. 
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A B Cc D 
Cc Di E F 
Clone 2: È ; | È 


Clone 3: 


Figura 9.5. Allineamento di cloni mediante mappatura con STS. Ogni clone contiene diversi STS. Il 
clone 1 ne ha quattro (A, B, C e D). Anche il clone 2 contiene gli STS C e D. Quindi i cloni 1 e 2 si 
sovrappongono tra loro. 


* Mappe STS. Un sito STS (Sequence Tagged Site) è un frammento di DNA, tipica- 
mente della lunghezza di 100-200 bp, generato mediante PCR da primer basati su 
sequenze note di DNA. Il sito genomico corrispondente a questa sequenza può es- 
sere etichettato per la sua capacità di ibridizzare con la sequenza in questione. Gli 
STS possono essere generati da geni precedentemente clonati, o da altre sequenze 
non-geniche prese a caso. I frammenti di DNA genomico clonati in una libreria 
possono quindi essere ordinati sulla base degli STS che contengono (Fig. 9.5). Que- 
sta tecnica è stata utilizzata per ordinare gli inserti provenienti da cromosomi umani 
individuali in una libreria YAC (Foote er a/., 1992), ma è caduta in disuso quando si 
è scoperto che alcuni YAC contenevano DNA umano proveniente da più di una lo- 
calizzazione genomica. Una mappa basata su STS dei cromosomi umani è stata tut- 
tavia costruita utilizzando una serie di ibridi da radiazione (Hudson et al., 1995). 


Le mappe fisiche, sebbene non riportino l'allineamento delle stesse sequenze di 
DNA, sono risultate immensamente utili per la produzione di librerie ordinate di 
cloni. La fase finale di ogni progetto di sequenziamento è comunque la determina- 
zione della sequenza delle basi di ogni singolo clone. Prima di esaminare come la 
sequenza del genoma umano sia stata ottenuta e assemblata, è utile comprendere 
come sia possibile ottenere sperimentalmente la sequenza di molecole di DNA. 


9.4 Sequenziamento dei nucleotidi 


L’uniformità della molecola di DNA e l’apparentemente monotona successione 
delle basi nucleotidiche può apparire una insormontabile barriera alla determina- 
zione dell’ordine preciso della sequenza delle basi all’interno di un acido nucleico. 
Nel 1966, Robert Holley pubblicò i risultati di un progetto durato 7 anni per se- 
quenziare il tRNA per l’alanina di lievito. Con i loro 80 nucleotidi circa di lun- 
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ghezza, i tRNA sono molecole relativamente piccole in confronto a geni completi, 
o a genomi completi. La prima molecola di DNA ad essere sequenziata è stata 
quella delle estremità coesive (cos) del batteriofago À (Wu e Taylor, 1971). Queste 
sequenze, lunghe solo 12 pb, furono ottenute in seguito alla sintesi di una molecola 
complementare di RNA e il successivo utilizzo della procedura di sequenziamento 
dell’RNA. I metodi impiegati erano tuttavia impraticabili per il sequenziamento di 
DNA su larga scala. Nel 1975, Fred Sanger e Alan Coulson misero a punto un me- 
todo di sequenziamento diretto del DNA noto come metodo plus-minus (Sanger e 
Coulson, 1975). Questo metodo utilizzava una DNA polimerasi, con inneschi di 
oligonucleotidi radio-marcati, per generare frammenti di DNA che potevano poi 
essere analizzati mediante elettroforesi e autoradiografia. Questa tecnica fu utiliz- 
zata per determinare l’intera sequenza di 5.386 bp del genoma del batteriofago 
®X174 (Sanger et al., 1977). 


9.4.1 Sequenziamento manuale del DNA 


Due metodi di sequenziamento alternativi, e migliorati rispetto ai precedenti, furono 
descritti nel 1977. Allan Maxam e Walter Gilbert misero a punto un metodo chimico 
per rompere il legame zucchero-fosfato di un frammento di DNA radioattivo in cor- 
rispondenza di una specifica base. Essi usarono specifici reagenti chimici per modi- 
ficare specifiche basi (ad es. la modificazione dei residui di T con permanganato di 
potassio) o gruppi di basi (ad es. la modificazione dei residui di A e di G con acido 
formico) prima della rottura dell’impalcatura zucchero-fosfato con piperidina in 
corrispondenza delle basi modificate (Maxam e Gilbert, 1980). La separazione dei 
prodotti della frammentazione usando elettroforesi su gel di poliacrilamide ad alta 
risoluzione rendeva possibile l’inequivoca attribuzione delle singole basi all’interno 
di una sequenza. Questo metodo era tuttavia limitato dalla lunghezza del DNA che 
poteva essere sequenziato nel corso di una singola reazione (circa 100 basi) e dall’u- 
tilizzo di reagenti drastici per la modificazione e la rottura del DNA. 

Fred Sanger e i suoi colleghi misero a punto un approccio alternativo basato 
sulla replicazione ad alta fedeltà del DNA ottenuta utilizzando una DNA polime- 
rasi (Sanger, Nicklen e Coulson, 1977b). Il loro approccio si basava sull’incorpora- 
zione di 2°, 3’ dideossinucleotidi nel filamento sintetizzato di DNA che generava 
frammenti terminanti in corrispondenza di una specifica base (Fig. 9.6) Il dideossi- 
nucleotide è privo del gruppo ossidrile al 3° (3'-OH) e, quindi, quando viene incor- 
porato in un filamento di DNA che si sta estendendo, ne blocca la replicazione 
dato che non è disponibile il gruppo 3°-OH per l’aggiunta di ulteriori nucleotidi. 
L'aggiunta del dideossinucleotide blocca, quindi, l'allungamento del filamento di 
DNA. Come originariamente descritto da Sanger, la replicazione del DNA partiva 
dopo il legame di un oligonucleotide complementare alla sequenza del DNA e la 
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Figura 9.6. La struttura di un deossinucleoside trifosfato e del suo dideossi-derivato. 


successiva incubazione con DNA polimerasi. Il filamento di nuova sintesi è quindi 
complementare al filamento di DNA a cui si lega l’oligonucleotide. La reazione di 
sequenza veniva suddivisa in quattro provette distinte. A ciascuna veniva aggiunta 
una miscela dei quattro deossinucleosidi trifosfato (ANTP) richiesti per la sintesi 
del DNA: uno di questi era radioattivo in modo che il filamento di nuova sintesi 
potesse essere facilmente rivelato. Inoltre, un singolo dideossinucleoside trifosfato 
(dd ATP, ddGTP, ddCTP o ddTTP) veniva aggiunto a ciascuna reazione nella con- 
centrazione di circa 1/10 dei corrispondenti deossinucleotidi. Quindi, ad esempio, 
nella reazione contenente ddATP, in corrispondenza di un residuo di T sul fila- 
mento stampo, nella maggior parte dei casi, viene incorporato dATP nel filamento 
di nuova sintesi. Tuttavia, potrà anche essere incorporato, con frequenza relativa- 
mente bassa, anche la forma dideossi del nucleotide, e in questo caso la sintesi del 
filamento terminerà in quel punto. Dato che nello stesso tempo vengono prodotte 
numerose molecole di DNA, questo processo porta alla formazione di una popola- 
zione di molecole radioattive di DNA, con l’estremità 5°- in comune, ma di lun- 
ghezza variabile all’estremità 3’- (Fig. 9.7). Questi prodotti possono essere separati 
mediante elettroforesi su gel di poliacrilamide e, quindi, si può procedere alla let- 
tura della sequenza. I gel utilizzati per separare i filamenti neosintetizzati conten- 
gono di norma elevate concentrazioni di urea (7M) e sono fatti correre ad elevato 
voltaggio in modo da riscaldare il gel a circa 70°C. Entrambi questi fattori hanno 
proprietà denaturanti sui frammenti di DNA e limitano la formazione di strutture 
secondarie che possono formarsi nelle molecole a singolo filamento con conse- 
guenti anomalie nella corsa elettroforetica. 


L'impiego della replicazione del DNA per il suo sequenziamento ha diversi 
vantaggi. 


* La sintesi del DNA può essere iniziata in qualunque punto noto di una sequenza 
di DNA attraverso la sintesi di un primer (innesco) appropriato. Questo non si- 
gnifica che sia necessaria la previa conoscenza della sequenza del DNA prima 
di intraprenderne il sequenziamento. Molti vettori di clonaggio di uso comune 
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(Capitolo 3) contengono sequenze oligonucleotidiche standard che fiancheg- 
giano i siti di clonaggio in modo che il DNA incognito che è stato clonato possa 
essere sequenziato. 


e A differenza della tecnica di Maxam e Gilbert, il filamento di DNA che deve es- 
sere sequenziato non è necessario che sia marcato radioattivamente. La marca- 
tura è richiesta per poter rivelare i prodotti di estensione fino alla terminazione. 
Un isotopo radioattivo (es. 3*P, 35S o 5P nella forma di un deossinucleotide mo- 
dificato nel fosfato ©) può essere incorporato nel filamento in estensione nel 
corso del processo di replicazione. 


e La molecola di DNA da sequenziare non deve essere necessariamente a singolo 
filamento. Il metodo originale di Sanger veniva utilizzato per sequenziare pro- 
dotti di restrizione lineari a doppio filamento, ma non poteva essere applicato per 
segenziare direttamente plasmidi a doppio filamento. Questo comportava l’im- 
piego molto diffuso di vettori M13 per produrre stampi di DNA a singolo fila- 
mento su cui condurre il sequenziamento (vedi Capitolo 3). Il DNA a singolo fi- 
lamento prodotto da M13 generalmente forniva sequenze chiaramente leggibili. 
La tecnica di Sanger è stata successivamente adattata per consentire la denatura- 
zione del DNA plasmidico con alcali in modo che questo fosse poi utilizzabile 
per le reazioni di sequenziamento (Yie, Wei e Tien, 1993). 


Sono state introdotte molte modifiche ai protocolli di sequenziamento basati sulla 
terminazione della sintesi enzimatica di DNA, ma il metodo di base ideato da 
Sanger è rimasto il cardine di quasi tutti i progetti di sequenziamento. Originaria- 
mente, veniva utilizzato come enzima replicativo il frammento di Klenow della 
DNA polimerasi I di E. coli, ma questo fu poi sostituito da una forma modificata 
della DNA polimerasi del batteriofago T7 (nota anche come Sequenase!M), che es- 
sendo un enzima più efficiente consente la lettura di una sequenza più lunga in una 
singola reazione (Griffin e Griffin, 1993). È essenziale che l'enzima impiegato sia 
privo dell’attività esonucleasica 5‘-3’ per assicurare l'integrità dei frammenti di DNA 
di nuova sintesi. Attualmente, la maggior parte del sequenziamento impiega la DNA 
polimerasi Taq. Le temperature elevate a cui l’enzima termostabile può replicare il 
DNA assicurano che le strutture secondarie siano mantenute al minimo in modo da 
poter leggere senza ambiguità sequenze più lunghe. L'uso della DNA polimerasi Taq 
viene spesso combinato con la termociclazione per amplificare un singolo filamento 
di DNA lineare a partire da un DNA duplex e un singolo primer (Murray, 1989). 
Questo elimina la necessità di due fasi separate per la denaturazione del DNA a dop- 
pio filamento e l’appaiamento del primer. Il metodo consente il sequenziamento di 
- quantità molto piccole di DNA a doppio filamento, e consente anche il sequenzia- 
mento diretto del DNA genomico da colonie batteriche o placche fagiche, senza la 
necessità di passare attraverso procedure di clonaggio (Slatko, 1996). 


venni 
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5'-CTAAGTCGACTGAACATTTGTCATGCATCGATC-3' 
3'-GATTCAGCTGACTTGTAAACAGTACGTAGCTAG-5' 
3'-AGTACGTAGCTAG-5' 

Primer di sequenziamento 


3'-GATTCAGCTGACTTGTAAACAGTACGTAGCTAG-5! 
3'-GCTGACTTGTAAACAGTACGTAGCTAG-5'! 

Gb 3'-GACTTGTAAACAGTACGTAGCTAG-5' 
3'-GTAAACAGTACGTAGCTAG-5' 


3'-ATTCAGCTGACTTGTAAACAGTACGTAGCTAG-5' 
3'-AGCTGACTTGTAAACAGTACGTAGCTAG-5' 

A>»> 3'-ACTTGTAAACAGTACGTAGCTAG-5' 
3'-AAACAGTACGTAGCTAG-5'! 
3'-AACAGTACGTAGCTAG-5' 
3'-ACAGTACGTAGCTAG-5' 


3'-TTCAGCTGACTTGTAAACAGTACGTAGCTAG-5'! 
3'-TCAGCTGACTTGTAAACAGTACGTAGCTAG-5'! 
3'-TGACTTGTAAACAGTACGTAGCTAG-5' 
3'-TTGTAAACAGTACGTAGCTAG-5'! 
3'-TGTAAACAGTACGTAGCTAG-5' 
3'-TAAACAGTACGTAGCTAG-5'! 


T» 


3'-CAGCTGACTTGTAAACACTACGTAGCTAG-5! 
Cc >» 3'-CTGACTTGTAAACAGTACGTAGCTAG-5! 
3'-CTTGTAAACAGTACGTAGCTAG-5! 


Direzione dell’elettroforesi 


dee. EP Pi dd dA dl > di le » O i di BP = 
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9.4.2 Sequenziamento automatizzato del DNA 


Il sequenziamento con la tecnica di Sanger può permettere la determinazione chiara 
e senza ambiguità di circa 300 basi per reazione. Questo metodo è, tuttavia, piutto- 
sto laborioso. Ad esempio, richiede numerose operazioni di pipettaggio e ogni rea- 
zione deve essere caricata su quattro diversi pozzetti di un gel per la separazione 
dei prodotti. In aggiunta, la lettura manuale dei gel di sequenza (Fig. 9.7), oltre a 
richiedere parecchio tempo, può anche comportare svariati errori. Per affrontare il 
problema del sequenziamento del genoma umano (-3,2 x 10° pb) è stato necessa- 
rio mettere a punto sistemi più rapidi e automatizzati per collezionare le sequenze. 
Un sistema immediato per aumentare la capacità di sequenziamento sarebbe 
combinare le quattro reazioni individuali (ciascuna contenente un diverso ANTP) in 
una reazione singola che verrebbe poi analizzata su una singola corsia di un gel. 
Questo non è possibile utilizzando la radioattività dato che ogni banda (Fig. 9.7) è 
distinguibile solo in base alla posizione che occupa alla fine della corsa sul gel. 
Quindi, la combinazione delle quattro corsie produrrebbe semplicemente una serie 
di bande distinte, differenti in dimensione per una singola base (Fig. 9.8). Tuttavia, 
se potesse essere identificata in modo specifico la base terminale di ogni fram- 
mento, allora si potrebbe leggere senza ambiguità la sequenza di DNA su una sin- 
gola corsia del gel dato che ogni banda sul gel corrisponde a frammenti di dimen- 
sioni diverse. A questo scopo è stato sviluppato un set di dideossinucleotidi dotati 
di marcatura fluorescente (Glazer e Mathies, 1997). Il dideossinucleotide può es- 
sere incorporato nel filamento di DNA, in corrispondenza della sua base comple- 
mentare, provocando ancora la terminazione della sintesi del DNA. Le strutture dei 
coloranti attaccati ai dideossinucleotidi, denominate BigDye!M, contengono un co- 
lorante donatore a base di fluoresceina, legato mediante un linker costituito da acido 
aminobenzoico, al colorante accettore a base di diclororodamina (dRhodamine). Un 
laser ionico ad argon può eccitare il colorante donatore a fluorosceina che trasferi- 
sce in modo efficiente l’energia ad uno dei quattro coloranti accettori, ciascuno con 
uno specifico spettro di emissione (Fig. 9.9). Ogni dideossinucleotide viene marcato 
con un differente colorante accettore in modo che i frammenti di DNA terminati da 
differenti À.dNTP emetteranno fluorescenza ad una diversa lunghezza d’onda. Le 


Figura 9.7. Sequenziamento del DNA usando terminatori di catena dideossinucleotidici. La replica- 
zione del DNA è iniziata da un primer oligonucleotidico e vengono condotte in parallelo quattro rea- 
zioni di sequenziamento, ciascuna delle quali contiene tutti i ANTP e un singolo ddNTP (G, A,T OC 
come indicato). La replicazione del DNA viene terminata quando il AdNTP (evidenziato in giallo) 
viene incorporato per generare una serie di molecole di DNA di differente lunghezza che si possono 
separare su un gel di poliacrilamide. La sequenza del filamento di nuova sintesi può essere letta sul 
gel nella direzione 5° + 3’, dal basso verso l'alto. Nell'esempio mostrato, il primer produce un nuovo 
filamento complementare da cui si può dedurre la sequenza dell'altro filamento. 
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Assegnazione delle sequenze 


Figura 9.8. Il sequenziamento in una singola corsia del gel è possibile solo se c'è un modo di identi- 
ficare ogni singola banda sul gel in base al particolare dideossi nucleotide responsabile della sua 
terminazione. 


reazioni di sequenziamento possono dunque essere condotte in una singola pro- 
vetta (o un singolo pozzetto di una micropiastra) e i prodotti separati o su una sin- 
gola corsia di un gel, o utilizzando un tubicino capillare impaccato con un gel 
(Karger er al., 1991). L'intensità e la lunghezza d’onda dell’emissione fluorescente 
viene misurata quando i frammenti di DNA passano attraverso un rilevatore laser 
di fluorescenza all’estremità inferiore del gel. Questa informazione viene inviata 
direttamente ad un computer in modo che la sequenza risultante può essere auto- 
maticamente letta e memorizzata. 

Sistemi software sofisticati per l'attribuzione delle basi sono disponibili per 
convertire il segnale di fluorescenza ottenuto in una sequenza di DNA (Fig. 9.10). 
In questo modo si ottiene un enorme aumento della velocità di sequenziamento ri- 
spetto alle tecniche di sequenziamento manuale. Da una singola reazione possono 
essere lette automaticamente fino a 1000 bp, anche se la sequenza fino a 500 bp 
dal primer è normalmente più affidabile di quella che segue. Inoltre, i metodi di ri- 
levazione utilizzati per il sequenziamento automatico sono di gran lunga più affida- 
bili delle letture autoradiografiche delle sequenze. In ogni caso il sequenziamento 
automatico non è infallibile. Ad esempio, vi possono essere fenomeni di compres- 
sione in presenza di lunghe ripetizioni di una singola base. In questo caso nell’elet- 
troferogramma si possono presentare picchi multipli sovrapposti che devono essere 
analizzati manualmente. 

Il vantaggio principale del sequenziamento automatico è la possibilità di 
automatizzarne praticamente tutti 1 passaggi. Le reazioni di sequenziamento pos- 
sono essere condotte da sistemi robotizzati nei pozzetti di micropiastre e sottopo- 
sti a sequenziamento con termociclazione. I prodotti possono essere poi purificati 
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Figura 9.9. Coloranti terminatori dideossinucleotidici utilizzati per il sequenziamento del DNA. (a) La 
struttura generale dei terminatori BigDye"M. | diversi terminatori hanno differenti proprietà di emis- 
sione in funzione della natura del gruppo R. (b) Lo spettro di emissione dei quattro terminatori 
BigDyeM. 


dalle piastre, caricati sulle colonne capillari e sottoposti ad elettroforesi senza ne- 
cessità di intervento manuale. Un sequenziatore automatico che operi come sopra 
descritto è in grado di generare tra 1 e 2 milioni di basi di DNA al giorno con ac- 
curatezza media per singola corsa tra il 98 e il 99%. Questo livello di accuratezza 
può sembrare impressionante, ma se venisse assegnata in modo non corretto una 
sola base ogni 100, avremmo che virtualmente le sequenze di tutti i geni potreb- 
bero contenere errori. È quindi necessario sequenziare più volte la stessa sezione 
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(a) 5'-..ACGCGCGGTGCTCAGATTGATACATAGCTACTGAT..-3' 
3'-..TGCGCGCCACGAGTCTAACTATGTATCGATGACTA. .-5' 
3'-ACTATGTATCGATGACTA-5' 
Primer di sequenziamento 


IMMA MM 


Sequenza ottenuta 


5'-ATCTGAGCACCGCGCG T-3' 


Conversione della sequenza 
nel filamento senso 


3'-TAGACTEGITIOOGCECOCA-S* 


y Riscrittura della sequenza 
in direzione 5’ a 3’ 
5'-ACGCGCGGTGCTCAGA T-3' 


(D) [MATGGAGATATCGG AACTGGTATTGAACGTITA 


Figura 9.10. Sequenziamento automatico del DNA. (a) Un primer per il sequenziamento viene usato 
per iniziare la sintesi del DNA terminata con un dideossi nucleotide marcato per fluorescenza. La se- 
rie di picchi ottenuti viene quindi separata nelle componenti fluorescenti individuali e la sequenza as- 
semblata sulla base dei dati ottenuti. (b) L’output della sequenza e dell’elettroferogramma generato 
da una macchina per sequenziamento automatico ABI Prism 377. 


di DNA, preferibilmente da cloni multipli contenenti diverse lunghezze della 
stessa sequenza di DNA, per assicurare un grado di accuratezza il più elevato pos- 
sibile. 


9.5 Sequenziamento di genomi 


Come abbiamo già visto (Capitolo 3), i genomi devono essere frammentati in se- 
zioni di dimensione appropriata per poter essere inserite in un vettore. Anche se 
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il sequenziamento può essere condotto direttamente sul DNA genomico, questo 
procedimento è di fatto impraticabile su larga scala a causa del gran numero di 
primer oligonucleotidici che sarebbe necessario sintetizzare per iniziare le rea- 
zioni di sequenziamento. I frammenti di DNA genomico vengono quindi clonati 
in un vettore e ciascun frammento viene successivamente sequenziato con i me- 
todi automatici sopra descritti. Il problema è quindi come ricostruire la sequenza 
originaria del genoma sulla base dei piccoli frammenti che sono stati clonati nei 
vettori individuali. Per risolvere tale problema sono stati impiegati diversi approcci 
sperimentali. 


e Sequenziamento da cloni contigui. La maniera più semplice per generare se- 
quenze sovrapposte di DNA è isolare e sequenziare un clone da una libreria, 
quindi identificare (mediante ibridazione) un secondo clone il cui inserto sia so- 
vrapposto al primo. Il secondo clone viene quindi sequenziato e l'informazione 
ottenuta usata per identificare un terzo clone, il cui inserto sia sovrapposto col se- 
condo, e così via. Questo principio è alla base del “chromosome walking” ed è 
stato il primo ad essere usato per costruire grandi sequenze continue di DNA 
(contigs) dai piccoli frammenti clonati nei vettori. Questo metodo è, tuttavia, 
piuttosto laborioso. Un singolo clone deve essere isolato e sequenziato prima di 
passare al successivo clone sovrapposto. Inoltre, le sequenze ripetute all’interno 
del genoma possono provocare errori nella costruzione delle sequenze contigue. 


e Sequenziamento con shotgun totale. Frammenti del genoma, che sono stati generati 
a caso, sono clonati in un vettore e ogni inserto viene poi sequenziato. La sequenza 
è quindi analizzata per rilevare eventuali sovrapposizioni (sequenze presenti in più 
di un clone) e il genoma viene ricostruito assemblando le sequenze sovrapposte 
(Fig. 9.11). Questo approccio è stato utilizzato la prima volta per sequenziare il ge- 
noma del batterio Haemophilus influenzae. L'intero genoma dell’organismo fu 
frammentato a caso mediante sonicazione, e i piccoli frammenti ottenuti (nell’in- 
tervallo di 1,5-2 kpb) clonati in un vettore (pUC18). La risultante libreria era costi- 
tuita da circa 20.000 cloni singoli. Ciascuno di questi cloni venne poi sequenziato 
per generare informazione di sequenza corrispondente a circa 12 milioni di paia di 
basi (Fleishman et al., 1995). Questo corrisponde a sei volte la lunghezza del ge- 
noma di H. influenzae. La sequenza ottenuta da ciascun clone venne quindi assem- 
blata in sequenze contigue sulla base della sovrapposizione tra cloni individuali. 
Possibili intervalli di sequenza (gaps) furono poi colmati successivamente identifi- 
cando cloni addizionali (da una diversa libreria) che conteneva sequenze vicine ai 
gaps. Questo approccio è tuttavia limitato dalla capacità di identificare sequenze 
sovrapposte. Ogni sequenza che viene ottenuta deve essere confrontata con ogni al- 
tra sequenza in modo da poter identificare le sovrapposizioni. Questo è un processo 
piuttosto lungo e laborioso, e richiede grosse capacità di calcolo (Myers et al., 
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Figura 9.11. Assemblaggio di dati genomici utilizzando gli approcci di shotgun totale o gerarchico. 
Adattato da Waterson, Lander e Sulston (2002), previa autorizzazione. 


2002). La ricerca delle sovrapposizioni è anche ostacolata dalla presenza di se- 
quenze di DNA ripetitivo nel genoma che possono portare all’incorretta assegna- 
zione delle sequenze contigue (Waterson, Lander e Sulston, 2002). 


e Sequenziamento con shotgun gerarchico. L'approccio shotgun per l’assemblag- 
gio delle sequenze contigue si è dimostrato incredibilmente efficiente per il se- 
quenziamento di genomi relativamente piccoli. La maggior parte dei genomi bat- 
terici si può sequenziare con questo metodo e le sequenze contigue assemblate 
nel giro di poche settimane, impiegando le tecnologie di sequenziamento auto- 
matico precedentemente descritte. Tuttavia, per genomi più grandi, la fase più 
lenta del processo non è il sequenziamento, ma l'assemblaggio delle sequenze 
contigue. L’assemblaggio delle sequenze contigue, può essere tuttavia molto 
semplificato se il DNA genomico viene prima frammentato in una serie di grossi 
cloni sovrapposti come quelli che si possono ottenere attraverso il clonaggio in 
vettori BAC (Capitolo 3). Una libreria di piccoli cloni viene quindi prodotta da 
ogni BAC e poi sottoposta al sequenziamento shotgun come precedentemente de- 
scritto. L'approccio gerarchico è una procedura relativamente semplice da ese- 
guire dato che l'assemblaggio delle sequenze contigue è locale e riguarda solo 
una particolare regione del genoma, la sequenza contenuta nel BAC. 


9.6 Il progetto genoma umano 


Il progetto genoma umano (Human Genome Project, HGP) partito ufficialmente 
nel 1990 fu lanciato per raggiungere i seguenti obiettivi: 
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e determinare la sequenza di DNA dell’intero genoma umano 
* collezionare questa informazione in banche dati 
* identificare tutti i geni umani 


e migliorare gli strumenti per l’analisi dei dati. 


Il progetto fu pianificato per una durata di 15 anni, ma gli sviluppi tecnologici 
hanno accelerato il suo completamento al 2003. Il 26 giugno 2000, durante una con- 
ferenza stampa congiunta, il Presidente Bill Clinton (USA) e il Primo Ministro Tony 
Blair (UK) annunciarono il completamento della prima bozza della sequenza del ge- 
noma umano. Per la generazione di questa prima bozza del genoma l’ordine delle 
basi su ogni cromosoma fu determinato almeno quattro o cinque volte per assicurare 
l'accuratezza dei dati e facilitare l'assemblaggio delle sequenze contigue. Questo 
sequenziamento ripetuto determina la “profondità della copertura” del genoma. I 
dati di sequenza allo stato di bozza sono principalmente costituiti dalle sequenze 
contigue di -10.000 bp di cui sono note approssimativamente le coordinate cromo- 
somiche. La sequenza del genoma umano non è identica tra individui distinti. Cam- 
pioni di DNA, estratti da sperma maschile e sangue femminile da diversi individui 
anonimi sono stati impiegati per la costruzione delle librerie che sono state poi uti- 
lizzate per il sequenziamento. Un gran numero di persone ha donato i campioni per 
la costruzione di queste librerie, ma solo pochi campioni sono stati realmente utiliz- 
zati e né i donatori né i ricercatori responsabili del sequenziamento erano al corrente 
della provenienza del DNA contenuto nei diversi campioni. È probabile che il DNA 
di 10-20 individui sia stato utilizzato per produrre la bozza di sequenza del genoma. 
La prima analisi della bozza dei dati di sequenza fu pubblicata nel febbraio 2001 da 
due gruppi in competizione tra loro: 1’ HGP (Lander er al., 2001) e l'industria bio- 
tecnologia Celera Genomics (Venter et al., 2001). HGP è un consorzio di 16 labora- 
tori accademici di ricerca che ha utilizzato un approccio di shotgun gerarchico per il 
sequenziamento del genoma. In qualità di ente dotato di finanziamenti pubblici, i 
dati ottenuti dal lavoro di sequenziamemto sono stati resi liberamente disponibili. Il 
principio delle Bermuda (determinato nel corso di una conferenza nelle Bermuda) 
stabiliva che gli assemblaggi di sequenza di 2 o piu kbp dovevano essere resi pub- 
blici entro 24 ore dalla loro generazione. La Celera Genomics utilizzò un approccio 
di shotgun totale per il sequenziamento del genoma umano. Impiegando un gran nu- 
mero di macchine per il sequenziamento. Celera completò la fase di sequenzia- 
mento del progetto in circa 9 mesi, e quindi applicò l'enorme potenza di calcolo dei 
suoi computer per ricostruire il genoma sulla base dei dati prodotti. 

Per generare una sequenza finale del genoma umano di elevata qualità, è ri- 
chiesto del sequenziamento aggiuntivo per chiudere i gaps, ridurre le ambiguità e 
far scendere il tasso di errore a meno di una base su 10.000, producendo un’accu- 
ratezza del 99,9999%, lo standard accettato per la sequenza finale. La sequenza fi- 
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nita avrà una profondità di copertura stimata per ciascun cromosoma da otto a nove 
volte. Ad oggi, è stato completato il sequenziamento dei tre cromosomi umani più 
piccoli, il 20, 21 e 22. I genomi completamente sequenziati di fatto non sono nor- 
malmente completi. Ad esempio, la sequenza di 56 Mbp del cromosoma 22 umano 
è stata dichiarata essenzialmente completa nel 1999, anche se solo 33,5 Mbp erano 
stati realmente sequenziati (Dunham et al., 1999). Anche del genoma di 180 Mbp 
del moscerino della frutta Drosophila melanogaster fu annunciato il completa- 
mento, anche se solo 120 Mbp erano stati sequenziati (Adams et al., 2000). I ge- 
nomi degli eucarioti superiori contengono grosse regioni di DNA che non si riesce 
a clonare, e quindi a sequenziare. Queste regioni includono telomeri e centromeri 
(le estremità e le parti centrali dei cromosomi), come pure molte aree cromosomi- 
che ricche in altre sequenze ripetute. La maggior parte delle regioni che non pos- 
sono essere sequenziate contengono DNA eterocromatico, che contiene pochi 
geni e molte regioni ripetute. Gli sforzi attuali si propongono di sequenziare il 
DNA eucromatico, contenente aree ricche di geni comprendenti sia esoni che in- 
troni. Nel caso del crosomoma 22 dell’uomo, il 60% che è stato sequenziato rap- 
presenta il 97% del DNA eucromatico. Analogamente, quasi tutte le regioni eu- 
cromatiche sono stata sequenziate in Drosophila. Sebbene l’obiettivo del progetto 
genoma umano fosse completare la sequenza di ogni cromosoma, determinarne 
l’effettiva sequenza completa rimante ancora una grande sfida. 


9.7 Identificazione dei geni 


Una volta ottenuta la sequenza di DNA del genoma, vari metodi possono essere 
impiegati per localizzare ed identificare i geni in esso contenuti. 


* Analisi delle sequenze. I geni che codificano per le proteine contengono “open 
reading frame” (ORF) costituite da una serie di codoni, cioè triplette di nucleo- 
tidi che specificano la sequenza di aminoacidi della proteina. L’ORF inizia con 
un codone d’inizio (normalmente ATG) e finisce con un codone di terminazione 
(TAA, TAG o TGA). La lunghezza media di una ORF varia tra le specie. In E. 
coli la lunghezza media di una ORF è 317 codoni, mentre in lievito la lunghezza 
media è 483 codoni. La maggior parte delle ORF hanno comunque una lun- 
ghezza superiore a 50 codoni. La ricerca per un gene può quindi essere condotta 
effettuando una scansione della sequenza alla ricerca di un codone d’inizio e di 
terminazione che, supponiamo, siano separati da almeno 100 codoni. Questo ap- 
proccio funziona abbastanza bene per i genomi compatti dei procarioti, in cui i 
geni sono separati solo da piccole regioni non codificanti, ma è difficile da appli- 
care ai genomi degli eucarioti superiori, in cui le ORF sono frammentate in esoni 
e introni. Vari programmi al computer sono disponibili per la identificazione 
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delle ORF (Fickett, 1996). In generale, questi programmi sono specie-specifici; 
ad es. GRAIL (Roberts, 1991) e GeneMark (Isono, McIninch e Borodovsky, 
1994) sono stati progettati per identificare ORF nel DNA umano e di altre specie 
individuali, rispettivamente. Questi programmi assegnano le ORF non solo sulla 
base dei codoni iniziatori e terminatori, ma identificano regioni probabilmente 
codificanti anche esaminando specifiche preferenze nell’uso dei codoni, defi- 
nendo i limiti sia degli esoni che degli introni e localizzando elementi di con- 
trollo trascrizionale (es. il TATA box). Sfortunatamente queste ultime sequenze 
possono essere piuttosto variabili, e la precisa identificazione dei geni rimane 
problematica. Un approccio alternativo per l’identificazione dei geni è usare 
come guida geni precedentemente identificati. È il gene che stiamo cercando di 
caratterizzare simile (omologo) ad un altro qualunque gene precedentemente 
identificato? Un pericolo di questo tipo di approccio è che gli pseudogeni (gene- 
ralmente costituiti da regioni non trascritte del DNA genomico con un elevato 
grado di similarità ad un gene reale) possono essere scambiati per geni reali. 


e Comparazione con cDNA. La maniera più semplice di identificare un gene in un 
segmento di DNA genomico è confrontarne la sequenza con una copia del corri- 
spondente cDNA. Il lettore ricorderà che il cDNA (Capitolo 5) viene prodotto 
dall’mRNA e contiene giusto le sequenze esoniche contenenti la ORF congiunte 
tra loro. Questa comparazione può essere effettuata o attraverso l’ibridazione di 
frammenti di DNA genomico a mRNA separati su un gel di agarosio (Northern 
Blotting, vedi Capitolo 2) o attraverso il confronto con la banca dati di sequenze 
di frammenti di cDNA. Le sequenze EST (Expressed Sequence Tags) sono 
frammenti di sequenza di cDNA (normalmente di lunghezza compresa tra 200 e 
500 bp) generati dal sequenziamento di entrambe o di una delle estremità di un 
gene espresso. Cloni casuali di cDNA vengono sequenziati per generare sezioni 
di sequenza che rappresentano geni espressi in certi tipi di cellule, tessuti o or- 
gani di diversi organismi. Questi frammenti possono quindi essere usati per iden- 
tificare i geni da cui sono stati espressi attraverso la comparazione delle se- 
quenze. Dato che le EST rappresentano una copia della porzione più interessante 
del genoma, quella che viene espressa, esse rappresentano uno strumento estre- 
mamente potente per dare la caccia ai geni. Le EST presentano, inoltre, diversi 
vantaggi pratici, le sequenze possono essere generate rapidamente e a costi con- 
tenuti; un solo esperimento di sequenziamento è richiesto per ogni cDNA che 
viene generato; le sequenze prodotte non devono essere controllate per eliminare 
errori di sequenziamento dato che gli errori non costituiscono un problema nell’i- 
dentificazione, mediante ricerca di similarità, del gene da cui la EST è derivata. 
Le banche dati di sequenze EST sono pubblicamente disponibili, ad es. dbEST 
(http://www.ncbi.nlm.nih.gov/dbEST/), contiene oltre 12 milioni di sequenze da 
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diversi organismi incluse 4,5 milioni di sequenze umane. Molte di queste se- 
quenze sono naturalmente ripetitive (Banfi, Guffanti e Borsani, 1998) con geni 
altamente espressi rappresentati molte volte. Inoltre, bisogna rilevare che i geni 
espressi a bassi livelli, o quelli la cui espressione è strettamente specifica per un 
tessuto o per uno stadio dello sviluppo, potrebbero non essere affatto presenti 
nella banca dati delle EST. 


9.8 Caratterizzazione funzionale dei geni 


I progetti di sequenziamento genomico hanno portato a risultati molto interessanti, 
e talvolta del tutto inaspettati. Per esempio, anche se £. coli e S. cerevisiae sono 
stati ampiamente studiati in vari laboratori per molti decenni, quando è stata resa 
disponibile la loro sequenza genomica si è realizzato che solo una frazione tra il 30 
e il 40% dei geni in essi contenuti sono stati precedentemente caratterizzati. In or- 
ganismi meno studiati dal punto di vista sperimentale, specialmente nell’uomo, po- 
chi geni erano noti prima che venissero intrapresi i progetti di sequenziamento ge- 
nomico. Vi sono, tuttavia, numerosi metodi normalmente impiegati per assegnare 
la funzione ad un gene sulla base della sua sequenza. 


* Ricerca di similarità. Proprio come i metodi computazionali giocano un ruolo 
importante nella definizione delle regioni del genoma che possono codificare per 
i geni, la disponibilità di banche dati di sequenze geniche note può anche essere 
usata per assegnare una funzione a geni ignoti. Ricerche di similarità come que- 
ste sono, di norma, condotte utilizzando sequenze aminoacidiche dato che il con- 
fronto delle sequenze nucleotidiche, che hanno quattro soli caratteri, può pro- 
durre similarità spurie, che non si osservano a livello delle sequenze proteiche. 
La maggior parte dei geni che codificano proteine con la stessa funzione in di- 
versi organismi risulteranno simili. Ad esempio, quasi tutti gli organismi hanno 
la capacità di convertire lo zucchero galattosio in glucosio-6-fosfato in modo che 
questo possa alimentare il ciclo glicolitico. Il primo passaggio di questa via me- 
tabolica è la conversione di galattosio in galattosio-1-fosfato, una reazione cata- 
lizzata dall’enzima galattochinasi. Tutti gli organismi possiedono l’enzima galat- 
tochinasi, e le galattochinasi di organismi differenti avranno una specifica se- 
quenza. Tuttavia, soprattutto per il fatto di catalizzare la medesima reazione chi- 
mica, tutte le galattochinasi sono correlate tra loro. Cioè, la sequenza aminoaci- 
dica della galattochinasi di un organismo somiglia alla galattochinasi di un altro 
organismo (Fig. 9.12). Sebbene solo del 30% dei circa 6000 geni di lievito fosse 
nota la funzione (vedi sopra), è stato possibile assegnare il ruolo di un ulteriore 
30% sulla base della similarità di sequenza (con geni a funzione nota). Comun- 
que il 40% dei geni identificati in lievito rimane ancora privo di funzione. Natu- 
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Figura 9.12. Confronto tra le sequenze di galattochinasi di diverse specie. (a) La reazione cataliz- 
zata dalla galattochinasi. (b) Confronto di una regione della galattochinasi umana (amino acidi 35-54 
della proteina di 392 amino acidi). Leggenda: Hs - Homo sapiens, Sc - Saccharomyces cerevisiae, 
Ec - Escherichia coli, Bs - Bacillus subtilis, Ca - Candida albicans, Hi - Haemophilus influenzae, 
St - Salmonella typhimurium, KI - Kluyveromyces lactis, At - Arabidopsis thaliana. Gli aminoacidi 
sono colorati in relazione alle loro proprietà. Gli aminoacidi carichi positivamente sono in blu (H, K, 
R), quelli carichi negativamente in rosso (D, E). i residui polari neutri in verde (S, T, N, Q), i residui 
alifatici non polari in grigio (A, V, L, I, M), e i residui aromatici non polari in porpora (F. Y, W). Il mar- 
rone è usato per indicare prolina e glicina, mentre il giallo indica la cisteina. 


ralmente, alcuni di questi geni potrebbero non essere reali, a causa di una errata 
annotazione, ma per la maggior parte di essi sarà necessario utilizzare altri ap- 
procci sperimentali per definirne la funzione. 


Caratterizzazione funzionale dei geni mediante indagini sperimentali. Negli or- 
ganismi modello come il lievito o E. coli, uno dei mezzi più utilizzati per sco- 
prire la funzione di un gene ignoto è costruire un knockout (KO) del gene. Come 
si vedrà nei capitoli seguenti, la ricombinazione omologa può essere usata sia nel 
lievito che negli eucarioti superiori per distruggere la copia funzionale di un gene 
all’interno di un genoma. L'analisi del fenotipo del mutante privo del gene fun- 
zionale può quindi portare all’identificazione della funzione naturale del gene 
wild-type. Questo approccio funziona bene per molti geni. Ad esempio, il gene di 
lievito precedentemente non caratterizzato SNU/7 non mostra similarità signifi- 
cative con altri geni mediante ricerche in banche dati. Un ceppo di lievito KO per 
SNUI7, tuttavia, mostra un fenotipo a crescita lenta ed è difettivo nello splicing 
del pre-mRNA (Gottschalk er al., 2001), indicando che la proteina è coinvolta 
nel processo di splicing. La maggiore difficoltà in questo tipo di approccio sta 


9.9 BIOINFORMATICA 311 


nel fatto che spesso il ceppo con il gene deleto o non è vitale o non è distingui- 
bile dal ceppo wi/d-type. In entrambi i casi non è possibile fare una attribuzione 
funzionale, nel primo caso risulta evidente che il gene in questione svolge un 
ruolo vitale nella cellula, ma oltre questo non ci sono ulteriori elementi per prefi- 
gurarne la funzione. Un approccio alternativo per l’analisi funzionale del gene è 
sovra-produrre la proteina, inserendo il gene in un plasmide ad elevato numero di 
copie, e tentare di osservare un fenotipo. 


Nonostante la disponibilità delle tecniche sopra descritte, nella maggior parte dei 
casi, l’analisi funzionale deve essere condotta analizzando un gene per volta. Que- 
sto richiede un lavoro sperimentale molto grande ma fattibile per i circa 2000 geni 
di lievito non ancora caratterizzati, ma appare impraticabile se riferito ai 30.000, o 
più, geni umani ancora ignoti. 


9.9 Bioinformatica 


La disponibilità di un’enorme quantità di dati di sequenza da un numero molto 
grande, e sempre crescente, di genomi completamente caratterizzati, ha posto in 
grande evidenza i problemi legati all’immagazzinamento e all’accesso dei dati. La 
bioinformatica è la disciplina che si occupa dello studio di questo tipo di informa- 
zione biologica. Per mezzo di approcci bioinformatici la valanga di dati biologici 
(ottenuta tramite sequenze genomiche ed altri esperimenti) può essere vagliata uti- 
lizzando teorie analitiche e gli strumenti pratici della matematica e delle scienze 
dell’informazione. Lo scopo della bioinformatica è: 


* Sviluppare nuovi algoritmi e metodi statistici per stabilire possibili relazioni tra i 
membri di una grande collezione di dati. 


Tabella 9.1. Progetti curati di sequenziamento genomico 


Organismo (tipo) Sito Web 
Escherichia coli (batterio) www.genome.wisc.edu 
Bacillus subtilis (batterio) genolist.pasteur.fr/SubtiList 
Saccharomyces cerevisiae (lievito) genome-www.stanford.edu/Saccharomyces 
Caenorhabditis elegans (nematode) www.wormbase.org 
Drosophila melanogaster flybase.bio.indiana.edu 
(moscerino della frutta) 
Arabidopsis thaliana (pianta) www.arabidopsis.org 
Mus musculus (topo) www.informatics.jax.org 


Homo sapiens (uomo) www.necbi.nlm.nih.gov/genome/guide/human/ 


312 PROGETTI DI SEQUENZIAMENTO GENOMICO 9 


e Analizzare ed interpretare vari tipi di dati incluse le sequenze di DNA e di ami- 
noacidi, i domini e le strutture proteiche. 


* Sviluppare ed implementare strumenti che siano in grado di garantire un accesso 
efficiente e la gestione di differenti tipi di informazione. 


Noi ci siamo già imbattuti nell’uso del computer per allineare le sequenze di DNA 
per formare sequenze contigue e nella ricerca di similarità geniche, ma il loro ruolo 
non si esaurisce in questo. L'informazione grezza della sequenza, cioè l’intera se- 
quenza di un cromosoma, depositata in una banca dati, è importante per l’analisi 
dei geni e delle loro funzioni. Forse è più importante, e certamente più utile per la 
maggioranza dei ricercatori, disporre di una collezione integrata di geni, proteine 
ed evidenze sperimentali che mettono in relazione la funzione di entrambi. Le ban- 
che dati curate (Tabella 9.1) si sforzano di mettere insieme tutte le informazioni di- 
sponibili e di presentarle in un formato più semplice da utilizzare, rispetto ad un 
mera lista di sequenze di DNA. Queste banche dati generalmente permettono ai 
loro utenti di effettuare ricerche per nomi di geni o proteine, o per sequenze, e 
spesso guidano gli utenti a selezionare anche la letteratura scientifica inerente il 
loro specifico ambito di ricerca. Come vedremo nel Capitolo 10, l’analisi delle re- 
lazioni tra i prodotti genici in una varietà di condizioni sperimentali fornisce un ul- 
teriore livello di complessità per comprendere la funzione dei geni. La capacità di 
integrare ed analizzare questi dati è vitale se si vogliono raccogliere reali benefici 
nell’era post-genomica. 


Analisi 
post-genomiche 


Concetti chiave 


+ La disponibilità della sequenza genomica ha permesso di progettare 
esperimenti per studiare ogni singolo gene o prodotto genico di un 
organismo 


+ Cambiamenti qualitativi e quantitativi nei geni espressi dalle cellule 
in diverse condizioni possono possono influenzare in modo radicale 
la risposta cellulare 


+ L'analisi di genomi, trascrittomi e proteomi è divenuta possibile per i 
sensibili miglioramenti nell’automazione dei processi e l'incremento 
della capacità di calcolo 


Il fatto che un genoma sia completamente sequenziato, può indurre il lettore a pen- 
sare che non siano necessarie ulteriori analisi genetiche. Quale altra ulteriore infor- 
mazione può essere prodotta quando è nota la sequenza di ogni singolo gene? Piut- 
tosto che rappresentare la fine di un processo, la conoscenza della sequenza geno- 
mica di un organismo non è che l’inizio di un’intera serie di nuovi esperimenti che 
potrebbero non essere stati concepiti in precedenza. In anni recenti il termine 
“oma” è stato impiegato come suffisso di quasi ogni fenomeno che possa essere 
descritto a livello cellulare (Fields e Johnston, 2002). Il termine genoma è facile da 
comprendere in quanto si riferisce al contenuto di DNA totale, che è normalmente 
costante in ogni singola cellula. Alcuni degli altri “omi”, tuttavia sono più difficili 
da definire e in molti casi sono soggetti a cambiamenti dipendenti dalle condizioni 
di crescita cellulare. 


* Trascrittoma — il contenuto di mRNA (e in generale di RNA)' di una cellula. 
Questo può cambiare dato che geni diversi sono espressi in differenti fasi dello 
sviluppo, in risposta a vari stimoli o alla disponibilità di nutrienti. I trascritti 
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espressi in una cellula sono indicativi delle proteine che da questa vengono pro- 
dotte, ma non ne riflettono necessariamente l’abbondanza relativa. Per esempio, 
un trascritto che contiene molti codoni rari può essere tradotto con minore effi- 
cienza, producendo quantità di proteina molto inferiori, rispetto alla stessa quan- 
tità di trascritto contenente codoni frequentemente utilizzati. 


* Proteoma — il contenuto in proteine di una cellula. Questo può essere immagi- 
nato come la componente tradotta di un genoma, ma in molti casi i prodotti pro- 
teici sintetizzati da una cellula possono differire da quelli predetti sulla base del 
trascrittoma. Le modificazioni post-traduzionali possono alterare radicalmente la 
funzione di molte proteine. 


* Metaboloma — le piccole molecole di metaboliti presenti all’interno della cellula. 
La quantità e l’identità dei metaboliti primari e secondari all’interno di una cel- 
lula può cambiare sensibilmente in funzione del suo stato fisiologico. Cambia- 
menti nel metaboloma possono, tuttavia, riflettere la funzione delle proteine ri- 
chieste per il metabolismo. 


La capacità di misurare cambiamenti in ciascuna delle tre componenti sopra de- 
scritte può aiutarci a comprendere in modo preciso i processi cellulari che hanno 
luogo in particolari circostanze. Per esempio, quali cambiamenti si verificano in 
una cellula durante la sua conversione da uno stato normale ad uno canceroso? 
Quali geni vengono spenti, o accesi? Quali proteine vengono prodotte, e in che 
modo queste differiscono dal normale corredo proteico? Un certo numero di tecni- 
che è stato messo a punto per far fronte a questi problemi. Molti degli esperimenti 
progettati per studiare gli effetti globali sulla funzione genica sono stati condotti uti- 
lizzando il lievito Saccharomyces cerevisiae come sistema modello eucariotico. Il 
lievito ha il vantaggio di possedere un genoma relativamente piccolo (-6.300 geni) 
con regioni intergeniche compatte e pochi introni. Queste caratteristiche, insieme 
alla possibilità di eseguire indagini genetiche approfondite e rapide, lo rendono un 
sistema ideale per lo studio delle interazioni tra i geni e i prodotti genici. La mag- 
gior parte degli esperimenti di seguito descritti sono stati eseguiti per la prima volta 
sul lievito prima di essere trasferiti ai genomi più grandi di eucarioti superiori. 


10.1 Cambiamenti globali nell'espressione genica 


Il livello di espressione dei singoli geni può essere modulato in risposta a una va- 
rietà di segnali intra- ed extra-cellulari. L'insieme dei geni espressi in una cellula in 
un particolare momento forniscono un’ “istantanea” delle proteine che essa sta pro- 
ducendo in quel momento. Per esempio, il trattamento di cellule umane con un 
particolare farmaco può indurre cambiamenti nell’espressione dei geni coinvolti 
nella risposta a quel farmaco; ad esempio, le proteine necessarie per il metaboli- 
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smo del farmaco potranno essere prodotte a livelli più elevati. Abbiamo già discusso 
diverse tecniche che si propongono di monitorare i cambiamenti nell’espressione 
dei geni, es. Northern blotting (Capitolo 2) e RT-PCR (Capitolo 4). Questi metodi, 
tuttavia, richiedono che vengano osservate alterazioni nell’espressione di specifici 
geni. Questo approccio, non solo limita il numero di geni che può essere analizzato 
ma restringe i risultati ottenuti ai soli geni di cui viene osservato il pattern di 
espressione. Il ricercatore che conduce l’esperimento dovrà stabilire a priori quali 
geni è probabile che vengano alterati in seguito ad un particolare trattamento. Un 
approccio molto più sistematico sarebbe testare i livelli di espressione di tutti i geni 
presenti nel genoma e osservare come questi sono modificati in particolari circo- 
stanze. Una varietà di approcci è stata messa a punto per seguire i cambiamenti 
dell’espressione genica su scala genomica. 


10.1.1 Esposizione differenziale (Differential display) 


Sebbene non richieda la conoscenza a priori della sequenza del genoma, il “diffe- 
rential display” è un metodo per monitorare i cambiamenti globali dei livelli dell’e- 
spressione genica sulla base dell’amplificazione sistematica delle estremità 3° 
delle molecole di mRNA (Liang e Pardee, 1992). Come abbiamo visto in prece- 
denza, le estremità 3’- della maggior parte delle molecole di mRNA contengono 
una coda di poliA. Si possono disegnare primer ancorati in grado di legarsi all’e- 
stremità 5°- della coda di poliA che fungano da innesco per una reazione di trascri- 
zione inversa (Fig. 10.1). I singoli filamenti di cDNA prodotti sono quindi amplifi- 
cati mediante PCR utilizzando il primer ancorato ed un primer a monte di se- 
quenza arbitraria, ma nota. Diversi primer arbitrari vengono impiegati per amplifi- 
care diversi set di molecole di cDNA derivanti da una popolazione di molecole di 
mRNA. La popolazione di prodotti di PCR ottenuta da questo metodo viene 
quindi separata mediante elettroforesi denaturante su gel di poliacrilamide, come 
sui gel per il sequenziamento del DNA visti nel Capitolo 9. La quantità di pro- 
dotto di PCR ottenuta da ogni molecola di mRNA nel campione originale do- 
vrebbe essere proporzionale alla quantità di RNA stampo da cui questo deriva. Di 
conseguenza, l’abbondanza relativa di singole molecole di mRNA può essere con- 
frontata direttamente in diversi campioni di RNA provenienti da fonti tra loro cor- 
relate. Utilizzando combinazioni multiple di primer, il differential display è in 
grado di visualizzare i geni espressi in una cellula in modo sistematico e sequenza- 
dipendente. Una delle prime applicazioni del differential display che è stata ripor- 
tata riguardava la comparazione degli mRNA di cellule sane e cellule tumorali, de- 
rivate da cellule umane dell’epitelio mammario, cresciute nelle stesse condizioni. 
L’identificazione di geni specificamente espressi nelle cellule tumorali, ma non 
nelle cellule normali (i potenziali oncogeni), o di quelli espressi esclusivamente 
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Figura 10.1. La tecnica del Differential Display per rilevare cambiamenti nell'espressione genica. 
(a) La conversione a cDNA viene ottenuta utilizzando in primo luogo un primer oligo-dT per creare 
un filamento di cDNA corrispondente all’estremità 3’ dell’estremità dell'mRNA. Ciascuno dei tre 
primer ancorati (la cui estremità 3°- sia G, A o C) produrrà una popolazione di molecole di cDNA in 
base alla presenza e all’abbondanza delle molecole individuali di MRNA all’interno del campione. La 
sintesi del secondo filamento viene quindi condotta con un set di primer arbitrari a sequenza nota. 
Differenti combinazioni di primer arbitrari e di primer oligo-dT ancorati amplificheranno tutte le possi- 
bili permutazioni del primo filamento di DNA. | frammenti prodotti per PCR vengono separati su un 
gel di poliacrilamide e le differenze di espressione dei geni all’interno del campione di tessuto pos- 
sono essere rilevate dall'analisi dell'intensità delle singole bande. (b) Differential Display di quattro 
campioni di RNA (uno normale e tre cancerosi) usando tre differenti primer ancorati (G, A e C) in 
combinazione con tre primer arbitrari (1, 2 e 3). Il riquadro bordato di rosso indica alcuni dei prodotti 
genici che sono altamente espressi nelle cellule tumorali ma non nelle cellule normali. Riproduzione 
autorizzata da GenHunter Corporation, www.genehunter.com 
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nelle cellule normali (i potenziali geni oncosoppressori), è importante per com- 
prendere le basi molecolari del cancro (Liang et al., 1992). 

Sequenze la cui espressione, identificata attraverso il differential display, risulti 
aumentata o repressa in particolari condizioni possono essere tagliate dal gel in cui 
sono state separate, ri-amplificate mediante PCR, clonate e sequenziate. 

I frammenti ottenuti in questo modo sono arricchiti delle estremità 3° terminali 
dei geni e quindi sarà improbabile il ritrovamento di cloni completi (full-length) 
dei cDNA. Le sequenze differenzialmente espresse possono, tuttavia, essere usate 
come sonde per isolare cDNA completi e DNA genomico sia attraverso lo scree- 
ning di librerie di cDNA che attraverso ricerche al computer. Il differential display 
è una tecnica potente per analizzare i cambiamenti dell’espressione genica: tutta- 
via, è soggetta al problema che cambiamenti anche apparentemente modesti delle 
condizioni cellulari possono produrre alterazioni significative nell’espressione di 
un gran numero di geni. Inoltre, sono necessarie combinazioni multiple di primer 
(> 300) per analizzare effettivamente tutte le potenziali molecole di mRNA che 
possono venir prodotte all’interno di una cellula (Crawford et al., 2002). 


10.1.2 Microarray 


Abbiamo già visto che il pattern dei geni espressi all’interno di una cellula è una 
caratteristica del suo stato corrente. La constatazione che i genomi non contengono 
un numero così grande di geni come si era immaginato, per esempio, circa 6.000 
nel lievito e forse meno di 30.000 nell’uomo, ha reso possibile l’analisi individuale 
dell’espressione di tutti i geni di un organismo. 30.000 esperimenti singoli sono 
ancora un numero enorme, ma i progressi nelle tecniche di automazione e nella 
manipolazione dei campioni oggi lo rendono possibile. Virtualmente, tutti i cam- 
biamenti di stato o tipo cellulare possono essere correlati con alterazioni nei livelli 
di mRNA dei geni. In alcuni casi, si hanno cambiamenti per un grande numero di 
geni. Per esempio, nel lievito il processo di sporulazione è associato con cambia- 
menti dell’espressione di almeno 1.000 geni diversi, che rappresentano quasi il 
20% del numero totale dei geni (Chu et a/., 1998). In altri casi, i cambiamenti nel- 
l’ambiente cellulare possono alterare l’espressione di un numero ristretto di geni, ad 
esempio, il trattamento di cellule di lievito con solfato di rame altera in modo signi- 
ficativo l’espressione di soli cinque geni (Grosse ef al., 2000). La conoscenza del 
profilo d'espressione di molti geni non caratterizzati in precedenza può anche for- 
nire indicazioni cruciali per comprenderne la funzione. L'analisi dei cambiamenti 
nell’espressione di tutte le migliaia o decine di migliaia di geni presenti in un ge- 
noma è essenziale alla comprensione delle relazioni tra i geni e i loro prodotti. 

I microarray a DNA sono stati sviluppati come un metodo per analizzare rapi- 
damente l’espressione di tutti i geni di un genoma (Shalon, Smith e Brown, 1996). 
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Figura 10.2. La costruzione di un microarray a DNA. Prodotti di PCR che rappresentano geni indivi- 
duali, parti di geni o altro DNA, sono depositati su un vetrino, e quindi fissati in una specifica posi- 
zione. Il DNA a singolo filamento risultante può quindi agire come sito di legame per sequenze di 
DNA complementari e marcate. 


Questi funzionano con frammenti di DNA a singolo filamento, fissati su una super- 
ficie, cui si possono legare frammenti di cDNA marcati (Fig. 10.2). I frammenti di 
DNA vengono fisicamente legati ad un supporto inerte (denominato chip). Un certo 
numero di tecnologie differenti vengono attualmente utilizzate per condurre esperi- 
menti con microarray. Esse differiscono nel modo utilizzato per legare le sequenze 
di DNA al chip, e nella lunghezza della stessa sequenza di DNA. I due sistemi più 
comunemente utilizzati sono quello sviluppato nel laboratorio di Patrick Brown alla 
Stanford University, e quello distribuito commercialmente dalla compagnia Affyme- 
trix®. I chip Affymetrix contengono oligonucleotidi di DNA a singolo filamento ot- 
tenuti per sintesi chimica (di —25 basi di lunghezza) legati ad una superficie di 
quarzo mediante l’utilizzo di agenti fotolabili e tecniche fotolitografiche simili a 


il 
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quelle impiegate nella produzione di microchip di silicio. Il risultato di questo pro- 
cesso può realizzare fino a 500.000 molecole individuali di DNA collocate con pre- 
cisione in un chip di 1,28 cm?. I chip di Stanford sono costruiti dalla deposizione 
mediante robot di frammenti di DNA, derivati dall’amplificazione mediante PCR di 
interi geni, in punti precisi di un vetrino. Nel caso del genoma di lievito sono state 
condotte 6.116 diverse reazioni di PCR per l’amplificazione di ogni singolo gene. I 
prodotti di PCR sono stati quindi depositati su un vetrino delle dimensioni di circa 2 
cm?. Ogni prodotto di PCR viene depositato in un punto preciso. Di conseguenza, è 
nota la sequenza di DNA di ogni singolo spot. Una volta depositato sul vetrino, il 
DNA è essiccato per riscaldamento a 100°C per 2 s, fissato mediante UV cross- 
linking, e quindi denaturato (2 min a 95 °C) per ottenere DNA a singolo filamento. 

I chip così allestiti sono utilizzati come target per il legame di frammenti di 
cDNA marcati. I frammenti di cDNA sono preparati come indicato in Figura 10.3. 
Vengono isolati i campioni di RNA da due pools correlati di cellule. Dato che le 
cellule sono correlate tra loro, la maggior parte dei geni avrà un profilo d’espres- 
sione simile. Le cellule, tuttavia, saranno state cresciute in condizioni differenti, o 
derivate da forme normali e cancerose dello stesso tessuto. I cDNA a singolo fila- 
mento vengono prodotti utilizzando la trascrittasi inversa e un primer oligo-dT. La 
sintesi di cDNA è condotta in presenza di tre deossinucleotidi trifosfato normali e 
un singolo deossinucleotide trifosfato marcato per fluorescenza. Uno dei campioni 
di cDNA è prodotto utilizzando un marcatore fluorescente verde (il nucleotide 
viene marcato con Cy3), mentre l’altro viene prodotto con un marcatore fluore- 
scente rosso (il nucleotide viene marcato con Cy5). Di conseguenza, il cDNA iso- 
lato da ciascun tipo di cellule porterà un marcatore fluorescente diverso. I cam- 
pioni di cDNA vengono poi miscelati in uguali quantità e fatti ibridare al chip per 
microarray. Il colore e l'intensità di ogni spot sul microarray viene monitorato con 
un microscopio confocale a scansione per fluorescenza. I marcatori vengono ecci- 
tati ad opera di un laser, e la fluorescenza rilevata ad ogni spot con il microscopio 
fornisce un’indicazione della quantità relativa di ogni specie di RNA nel campione 
originale. Per esempio, come mostrato in Figura 10.3 se le cellule cresciute nella 
condizione 1 esprimono un gene che non viene espresso nella condizione 2, allora 
la miscela di cDNA conterrà solo la versione Cy3 del corrispondente cDNA mar- 
cato e lo spot corrispondente sul microarray apparirà di colore verde. Allo stesso 
modo se un gene viene espresso solo da cellule cresciute nella condizione 2 si 0s- 
serverà uno spot rosso sul microarray. I geni espressi allo stesso modo in entrambi 
i campioni formeranno uguali quantità di cDNA con marcatura verde e rossa, ed 
entrambi si legheranno alla sequenza complementare sull’array. In questo caso si 
osserverà uno spot di colore giallo (dato dalla mescolanza di rosso e verde). 

È importante che ogni microarray venga calibrato in modo che i livelli di mRNA 
da ciascuno dei campioni possa essere determinato con cura (Bilban et a/., 2002). Il 
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Figura 10.3. Identificazione di geni la cui espressione risulta differente in campioni diversi di RNA 
mediante analisi con microarray. (a) RNA da cellule cresciute nella condizione 1 è isolato e convertito 
in cDNA con un primer oligo-dT, esso stesso marcato con una sostanza fluorescente di colore verde 
(Cy3). Allo stesso modo cellule cresciute nella condizione 2 vengono isolate e convertite in cDNA uti- 
lizzando un marcatore fluorescente rosso (Cy5). | campioni di cDNA sono miscelati in proporzioni 
uguali e ibridati al microarray. L'analisi del microarray con un microscopio a fluorescenza rivela una se- 
rie di spot colorati. Uno spot verde indica che lo spot corrispondente è espresso esclusivamente nella 
condizione 1, mentre uno spot rosso indica che lo stesso gene viene espresso solo nella condizione 2. 
Se quantità uguali di cONA derivate da cellule di tipo 1 e 2 si legano al DNA a singolo filamento sull’ar- 
ray, avremo il legame di quantità equivalenti di colorante verde e rosso, che produrranno uno spot 
giallo. (b) Un microarray derivato da sequenze geniche di topo impiegato per analizzare differenti 
campioni di RNA e studiare l’espressione dei geni. Per gentile concessione di Yanxia Hao e Chri- 
stopher Barker, The J. David Gladstone Institutes Genomic Core Laboratory, San Francisco. 


rapporto tra il segnale fluorescente verde e rosso viene calcolato per diversi spot del- 
l’array che contengono DNA genomico totale. Il rivelatore di fluorescenza può essere 
calibrato così che su questi elementi venga misurato un rapporto delle intensità pari a 
1,0. L'intensità relativa dei segnali verde e rosso può quindi essere usata come una 
misura dell’abbondanza relativa di uno specifico mRNA in ogni campione. 

C'è stata un’esplosione nell’uso dei microarray a DNA per analizzare l’espres- 
sione dei geni su scala genomica. Qui verranno discussi alcuni esempi specifici in 
cui la determinazione del profilo di trascrizione è stata utilizzata per studiare certi 
problemi biologici, ma molti altri sono riportati in letteratura (Lockart e Winzeler, 
2000; Shoemaker e Linsley, 2002). 


* Espressione genica associata a cambiamenti metabolici. I microarray a DNA 
sono stati usati per misurare l’espressione relativa di tutti i geni di lievito durante 
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il “diauxic shift” di lievito (il passaggio dalla crescita fermentativa a quella respi- 
ratoria che ha luogo se il glucosio viene rimosso dal mezzo di crescita) (De Risi, 
Iyer e Brown, 1997). Le cellule di lievito furono raccolte da una coltura ogni due 
ore per un certo periodo di tempo e usate per confrontare i geni da queste espressi 
rispetto al pattern iniziale d'espressione. Dagli mRNA isolati ai diversi tempi si 
ottennero cDNA marcati per fluorescenza con Cy5, mentre le cellule raccolte al 
tempo zero (campione di riferimento) furono marcate con Cy3. Il cDNA corri- 
spondente a ciascuno dei tempi analizzati fu poi miscelato con il campione di ri- 
ferimento e ibridato ad un microarray contenente tutti i -6.000 geni di lievito. Si 
osservarono globalmente cambiamenti drastici nell'espressione dei geni (non ap- 
pena il glucosio veniva rimosso dal mezzo di coltura Fig. 10.4). Circa il 30% dei 
geni presenti nel genoma mostrò livelli alterati d'espressione. Questi geni risulta- 
vano sovra- o sotto-regolati per almeno un fattore di due rispetto al materiale di 
partenza. Lo shift metabolico che segue alla rimozione del glucosio risultava cor- 
relato con estesi cambiamenti nell’espressione dei geni coinvolti in molti processi 
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Figura 10.4. Microarray per l’identificazione dei flussi attraverso i circuiti metabolici. (a) Un'immagine 
del microarray del genoma di lievito in cui l'mRNA di cellule cresciute in un mezzo ricco di glucosio è 
stato marcato con Cy3 (verde) e l'mRNA di cellule cresciute in terreno privo di glucosio è stato mar- 
cato con Cy5 (rosso). (b) La ri-programmazione metabolica nel corso del “diauxic shift”. | geni codifi- 
canti per gli enzimi mostrati in rosso durante il “diauxic shift” incrementano la loro espressione del 
fattore indicato, mentre l'espressione dei geni in verde diminuisce. Le frecce rosse indicano i pas- 
saggi della via metabolica i cui geni risultano fortemente indotti in seguito alla rimozione di glucosio. 
Queste figure sono state gentilmente fornite da Joe DeRisi (UC San Francisco) e sono ristampate 
previa autorizzazione di DeRisi, Iyer e Brown (1997). Copyright 1997 American Association for the 
Advancement of Science. 
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Figura 10.4. (continua) 


cellulari fondamentali come il metabolismo del carbonio, la sintesi proteica e 
l’accumulo di carboidrati. Tuttavia, per circa il 50% dei geni differenzialmente | 
espressi identificati in seguito all'analisi con microarray non era nota la funzione. 


* Differenze nell’espressione tra cellule normali e tumorali. I microarray a DNA 
sono stati molto usati per cercare di caratterizzare geni differenzialmente espressi | 
nelle cellule cancerose. Ad esempio, l’attività di -5.500 geni espressi nelle cel- 
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lule epiteliali della mammella umana è stata confrontata con quella del corri- 
spondente tessuto tumorale (Perou et al., 1999). Questo approccio ha permesso 
l’identificazione di un set di geni che potrebbero essere coinvolti nella prolifera- 
zione cellulare durante la crescita tumorale. Un altro importante impiego dei mi- 
croarray per la cura dei tumori è la classificazione delle cellule cancerose sulla 
base dei geni da queste espresse. Ad esempio, l'assegnazione di sottotipi prece- 
dentemente non classificati a cellule di melanoma maligno può essere fatta sulla 
base del pattern d’espressione genica (Bittner et al., 2000). Questi sottotipi (Fig. 
10.5) possono essere usati per effettuare una prognosi di singoli melanomi che in 
altro modo non sarebbe possibile. Un’analisi simile per confrontare pattern di 
espressione genica con il decorso clinico è stata intrapresa anche per una varietà 
di tumori della mammella (Sorlie et a/., 2001). 
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Figura 10.5. La caratterizzazione di melanomi maligni sulla base del loro profilo d'espressione ge- 
nica. Vedi il testo per ulteriori dettagli. Figura gentilmente concessa da Mark Bittner (The National 
Human Genome Research Institute, NIH, USA), ristampata previa autorizzazione di Nature (Bittner 
et al., 2000) copyright (2000) Macmillan Publishers Ltd. 
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e Definizione del tipo cellulare. Le cellule staminali, che saranno discusse in detta- 
glio nel Capitolo 13, differiscono dalla maggior parte delle altre cellule di mam- 
mifero sia per la loro capacità di autorinnovarsi che di differenziarsi in una va- 
rietà di tipi cellulari distinti, in seguito a segnali appropriati. I tre tipi meglio ca- 
ratterizzati di cellule staminali sono stati isolati da tessuto embrionale, neurale ed 
ematopoietico (Blau, Brazelton e Weimann, 2001). Utilizzando i microarray, il 
profilo trascrizionale di questi tre tipi differenti di cellule staminali ha rivelato la 
presenza di circa 200 geni che sono espressi in diversi tipi di cellule staminali, 
ma non in cellule differenziate (Ivanova et al., 2002; Ramalho-Santos et al., 
2002). Questi geni possono essere responsabili dello specifico programma gene- 
tico che conferisce alle cellule le proprietà tipiche delle cellule staminali. 


I microarray a DNA offrono l'opportunità di analizzare l’espressione di molte mi- 
gliaia di geni in un singolo esperimento. Hanno, tuttavia, una serie di limitazioni: 
ad esempio, come per tutti gli altri esperimenti che abbiamo discusso basati sul- 
l’ibridazione tra acidi nucleici, la cross-ibridazione di sequenze molto simili può 
risultare problematica. I dati ottenuti da esperimenti condotti con microarray de- 
vono quindi essere confermati con l’ausilio di esperimenti più tradizionali per ana- 
lizzare l’espressione genica. In aggiunta, la sensibilità generale dell’esperimento 
con microarray non è elevata. I cambiamenti nell’espressione di un gene possono 
normalmente essere rilevati solo se si osservano cambiamenti di un fattore due 0 
più. I cambiamenti dell’espressione più sottili, che possono però giocare un ruolo 
fisiologico vitale, non vengono rilevati dall'analisi con microarray. Naturalmente, 
la produzione di alcune proteine non viene regolata solo a livello della trascrizione. 
Ad esempio il gene codificante per l’attivatore trascrizionale Gen4p di lievito viene 
trascritto costitutivamente, ma la produzione di proteina è controllata a livello della 
traduzione in risposta alla privazione di aminoacidi (Hinnebusch, 1997). Infine, la 
valanga di dati generata dai microarray ha comportato notevoli problemi sia per de- 
finirne una strategia efficace di analisi che per la loro raccolta in un formato accessi- 
bile. Gli sforzi di molti bioinformatici sono ora concentrati a presentare questi dati 
in modo utilizzabile dai biologi. Le banche dati da esperimenti di microarray, grezzi 
o normalizzati, disponibili pubblicamente (es. www.dnachip.org) ci consentono 
l'interrogazione dei dati per vedere come il gene di nostro interesse è regolato in 
particolari condizioni. 


10.1.3 ChIP per tutti gli usi 


Una naturale estensione della problematica relativa all’identificazione dei geni 
espressi in particolari condizioni è quella di chiederci quali siano i fattori di trascri- 
zione che controllano i geni sottoposti a regolazione. I metodi biochimici tradizio- 
nali (es. DNA footprinting e gel retardation) sono stati impiegati per identificare le 
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regioni di DNA a cui si possono legare i fattori di trascrizione. Si possono determi- 
nare i geni sotto il controllo di un fattore di trascrizione individuando particolari 
siti di legame all’interno del promotore del gene. Questo approccio risulta molto 
efficace per trovare potenziali geni target, ma è limitato dal fatto che molti fattori 
trascrizionali si legano a siti sul DNA relativamente poco definiti e che si osser- 
vano nel genoma in un numero di gran lunga maggiore rispetto al numero di geni 
effettivamente sotto il controllo del fattore stesso. È dunque necessario trovare un 
modo per identificare veri siti di legame sul DNA che siano target di specifici fat- 
tori di trascrizione sulla base delle sequenze che effettivamente vengono da questi 
riconosciute nelle cellule. L’immunoprecipitazione della cromatina (ChIP, Chro- 
matin ImmunopPrecipitation) è un metodo messo a punto proprio per gli scopi sud- 
detti (Strahl-Bolsinger er a/., 1997). Le cellule in fase di crescita vengono trattate 
con formaldeide, un agente in grado di formare cross-link che legano covalente- 
mente proteine e DNA che siano in stretta prossimità tra loro (Fig. 10.6). Si rom- 
pono quindi le cellule ed il DNA viene frammentato per sonicazione, in modo da 
generare frammenti di lunghezza pari a circa 500 bp. I frammenti di DNA legati da 
specifiche proteine sono poi separati dal resto dei frammenti non legati, sfruttando 
l’interazione della proteina con un suo anticorpo specifico. I complessi antigene- 
anticorpo possono essere precipitati usando sferette in grado di legarsi in modo 
specifico agli anticorpi. Riscaldando i campioni immunoprecipitati a 65 °C per 12- 
18 h si rimuovono i cross-link tra DNA e proteine con il conseguente rilascio del 
DNA dai complessi DNA-proteina. La presenza di specifiche sequenze promotrici 
nella frazione immunoprecipitata può, infine, essere saggiata mediante PCR. Pri- 
mer specifici per promotori di singoli geni possono essere usati per rivelare la pre- 
senza di quella particolare sequenza nella frazione di DNA associata all’anticorpo 
(Hecht e Grunstein, 1999). Una PCR positiva indica la presenza di uno o più siti di 
legame nel promotore analizzato per la proteina contro cui era diretto l’anticorpo. 
Con un accurato disegno della reazione di PCR è possibile determinare l’occupa- 
zione relativa dei singoli siti di legame all’interno di un promotore. Inoltre, i cam- 
biamenti nell’occupazione dei siti promotore associati con l'alterazione delle con- 
dizioni cellulari possono essere osservati anche esaminando variazioni dell’inten- 
sità dei prodotti di PCR. 

L'analisi ChIP è un mezzo potente per individuare siti di legame sul DNA di 
proteine in promotori noti. Tuttavia, la tecnica è ancora più potente e utile se com- 
binata con i chip di microarray per identificare i siti di legame su scala genomica. 
Come mostrato in Figura 10.6, i frammenti di DNA fissati con cross-link alle pro- 
teine d’interesse vengono arricchiti in seguito alla immunoprecipitazione con un 
anticorpo specifico. Dopo la reversione del cross-link, il DNA arricchito è amplifi- 
cato e marcato con un colorante fluorescente (Cy5). Un campione di DNA non ar- 
ricchito dall’immunoprecipitazione viene invece marcato con un differente fluo- 
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Figura 10.6. Immunoprecipitazione della cromatina (ChIP) per l’identificazione delle regioni sul 
genoma contenenti specifici siti di legame per il DNA. Vedi il testo per ulteriori dettagli. 


roforo (Cy3), e una miscela dei pools di DNA marcato, arricchito e non, vengono 
ibridati ad un microarray contenente tutte le sequenze intergeniche e promotrici. 
Questo sistema è stato usato la prima volta per identificare i siti di legame sul 
genoma di due fattori di trascrizione del lievito, Gal4p e Stel2p (Ren er al., 2000). 
Tre target genici precedentemente sconosciuti sono stati identificati usando questa 
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analisi chiamata di ChIP-on-chip. Successivamente, sono stati identificati i siti di 
legame per 106 attivatori trascrizionali di lievito (e dei rispettivi geni target) (Lee 
et al., 2002). Ulteriori esperimenti hanno permesso di estendere l’analisi dei siti di 
legame per i fattori di trascrizione agli insetti (Barman et al. 2002). La significati- 
vità di queste osservazioni non è stata ancora completamente compresa, ma sembra 
suggerire un ordine superiore di organizzazione dei geni nel genoma in grado di 
controllarne l’espressione. 


10.2 L'analisi della funzione delle proteine su scala genomica 


Conoscere quali geni vengono espressi in una cellula in ogni particolare momento 
è un’informazione molto utile, ma non fornisce informazioni sulla funzione dei 
loro prodotti. Sono quindi stati sviluppati vari metodi per analizzare la funzione 
delle proteine su scala genomica. Questi metodi consistono o nella inattivazione di 
specifici geni in modo che le proteine corrisponenti non siano presenti nella cel- 
lula, o nella identificazione delle interazioni tra specifici set di proteine. 


10.3 Analisi di knock-out 


A fronte di decenni di approfondite analisi genetiche, solo a circa un terzo dei 
-6.000 geni di lievito è stato possibile assegnare una funzione. L'eliminazione di 
un singolo prodotto genico dal genoma può fornire rilevanti indizi sulla funzione 
del gene mediante l’analisi del fenotipo del risultante gene mutato. Per molti anni, 
i ricercatori sono stati in grado di inattivare singoli geni in lievito attraverso la ri- 
combinazione omologa (Rothstein, 1983). Questo processo, che si verifica con ele- 
vata frequenza in lievito, permette di sostituire un gene target con un altro gene che 
conferisce un fenotipo selezionabile (Fig. 10.7). Un frammento di DNA lineare che 
contiene il gene selezionabile viene costruito in modo tale da essere fiancheggiato 
alle sue estremità 5°- e 3°- da almeno 50 bp di sequenza derivata dal gene che deve 
essere inattivato. La trasformazione del lievito con questo frammento di DNA, che 
non è in grado di replicarsi autonomamente, porta alla sua integrazione nel genoma 
in precisa corrispondenza della sequenza omologa. Di conseguenza, il gene target 
originariamente localizzato tra le sequenze omologhe, verrà eliminato e sostituito 
dal gene selezionabile. La determinazione dell’intera sequenza del genoma di lie- 
vito ha reso possibile l’inattivazione sistematica di tutti i geni (Winzeler et al., 
1999). Il metodo utilizzato si avvale di una strategia genetica basata sulla PCR per 
generare mutanti di delezione per ogni gene dal codone di inizio a quello di termi- 
nazione. Nel corso del processo di delezione, ogni gene target è sostituito da una 
cassetta KanMX (Wach et al., 1994). Questa cassetta contiene la ORF di KAN® 
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Figura 10.7. Knock-out genico in un unico passaggio in lievito. La trasformazione del lievito con un 
frammento di DNA lineare contenente un gene selezionabile (URA3 forma parte della via biosintetica 
dell’uracile) fiancheggiato da sequenze di DNA genomico porta al suo inserimento in una regione 
omologa del genoma (indicata dalle linee tratteggiate). Il gene tra le sequenze omologhe viene elimi- 
nato e sostituito dal gene selezionabile. 


del trasposone Tn903 di £. coli fuso alle sequenze di controllo trascrizionale e tra- 
duzionale del gene TEF del fungo filamentoso Ashbya gossypii. L'inserimento 
della cassetta nel genoma di lievito consente una efficiente selezione dei trasfor- 
manti che diventano resistenti all’antibiotico geneticina (G418). 


L'’inattivazione di un gene può causare uno dei seguenti fenotipi. 


* Letale. La cellula mutante è incapace di crescere. Il gene è essenziale per qualche 
aspetto del processo di crescita. I geni essenziali in lievito possono essere ricono- 
sciuti dal modo in cui segregano durante la sporulazione. 


* Wild-type. Non si rileva alcuna differenza osservabile tra le cellule mutate e 
quelle wild-type. Se nessuna differenza può essere rilevata in una varietà di diffe- 
renti condizioni, è probabile che vi sia un altro gene in grado di compensare la 
perdita, oppure che non siano ancora state individuate le specifiche condizioni in 
cui sarebbe possibile osservare un fenotipo. 


* Differenze nella crescita. Il ceppo con la delezione può crescere più lentamente 
(o più rapidamente) del corrispondente ceppo wild-type in particolari condizioni. 
Una batteria di differenti condizioni di crescita, ciascuna testata per una varietà 
di condizioni, può essere usata per identificare i potenziali ruoli della proteina 
codificata dal gene. 


L'analisi dei mutanti di delezione di lievito ha mostrato che circa il 20% dei geni di 
lievito presenti nel genoma sono essenziali per la crescita su un mezzo ricco di glu- 
cosio e, in altri screening, il 15% delle delezioni ha prodotto degli effetti sulle di- 
mensioni della cellula o sulla sua morfologia (Giaever et al., 2002). Screening 
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come questo forniscono una misura abbastanza grossolana della funzione dei sin- 
goli geni, ma l’analisi dei diversi set di geni richiesti per la crescita in differenti 
condizioni può dare informazioni molto utili. Inoltre, l’analisi di delezione può es- 
sere combinata con quella dei profili d'espressione (microarray, vedi sopra) per 
confrontare i pattern d’espressione tra i ceppi mutati e wild-type e ottenere ulteriori 
indicazioni per determinare la funzione dei geni in esame. Per esempio, la dele- 
zione del repressore trascrizionale TUP/ induce un’aumentata trascrizione per il 
3% dei geni di lievito (DeRisi, Iyer e Brown, 1997). È probabile che questi geni 
vengano repressi da TUP/ in cellule wild-type. 


10.4 RNA antisenso e interferenza da RNA (RNAI) 


La costruzione di knockout genici negli eucarioti superiori non è così diretta come 
descritto in precedenza per il lievito, sia per la bassa frequenza di ricombinazione 
omologa, che per la difficoltà di applicare tecniche genetiche appropriate. Da qual- 
che tempo, tuttavia, è noto che l’espressione di RNA antisenso (che rappresenta la 
sequenza complementare a quella dell’mRNA) può inibire l’espressione genica 
(Green, Pines e Inuye, 1986). Le sequenze antisenso possono essere prodotte al- 
l’interno della cellula invertendo la sequenza codificante di un gene rispetto al suo 
promotore in modo che venga trascritto il filamento complementare. La forma- 
zione di un duplex complementare tra Y'mRNA e il suo antisenso si pensa possa in- 
terferire sia con la maturazione dell’mRNA che con la sua traduzione, riducendo 
drasticamente la produzione della proteina codificata. Ad esempio, le piante di po- 
modoro che esprimono una versione antisenso del gene poligalatturonasi, il cui 
prodotto induce ammorbidimento e sovra-maturazione, producono circa il 5% dei 
normali livelli della proteina poligalatturonasi e possono essere conservati più a 
lungo mostrando una maggiore resistenza alle ammaccature (Smith et al., 1988). 
L'espressione di RNA antisenso all’interno delle cellule, o l'introduzione nelle cel- 
lule di oligonucleotidi antisenso, può avere effetti drastici sulla produzione della 
proteina codificata dall’mRNA corrispondente. L'introduzione nelle cellule di un 
vettore d’espressione inducibile per un RNA antisenso può determinare un silen- 
ziamento genico condizionale. Per esempio, l’espressione di RNA antisenso da un 
promotore inducibile da tetraciclina (vedi Capitolo 8) può permettere la specifica 
inibizione della produzione di proteina solo in presenza di tetraciclina (Handler e 
Tozzo, 2001). L'efficienza dell’inibizione antisenso può variare di molto tra le spe- 
cie e per i diversi geni, e specifiche sequenze antisenso possono portare all’inibi- 
zione non-specifica della produzione di proteine (Cohen, 1991). 

È stato anche scoperto che l’espressione di geni singoli in una varietà di euca- 
rioti può essere drasticamente ridotta in seguito all’introduzione nelle cellule di 
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specifiche molecole di RNA a doppio filamento. Questo fenomeno, noto come in- 
terferenza da RNA (RNAi), è stato notato per la prima volta nel corso di esperi- 
menti di iniezione di RNA nel nematode Caenorhabditis elegans. L’iniezione dei fi- 
lamenti senso o antisenso dell'RNA di uno specifico gene provocava una minima ri- 
duzione dell’espressione del gene. Tuttavia, la co-iniezione di entrambi i filamenti 
senso e antisenso provocava una drastica riduzione dell’espressione del gene (Fire e? 
al., 1998). Numerosi esperimenti analoghi sono poi stati successivamente eseguiti. 


e L'introduzione in C. elegans di un RNA a doppio filamento corrispondente ad 
uno specifico gene provocava la specifica scomparsa del prodotto genico corri- 
spondente sia dalle cellule somatiche che dalla progenie FI1. 


e Gli RNA a doppio filamento erano anche in grado di inibire a distanza la fun- 
zione genica rispetto al sito di iniezione e sembravano capaci di attraversare le 
membrane cellulari suggerendo che una piccola molecola diffusibile potesse es- 
sere responsabile dell’effetto di repressione. 


* Solo sequenze di RNA a doppio filamento corrispondenti a esoni avevano un ef- 
fetto sulla produzione delle proteine, mentre quelle corrispondenti agli introni 
non avevano alcun effetto. 


* Sequenze di RNA a doppio filamento relativamente piccole, considerevolmente 
più piccole della dimesione dell’intero gene, erano in grado di bloccare la produ- 
zione della proteina codificata dal corrispondente mRNA. 


* Quantità molto piccole di RNA a doppio filamento, corrispondenti a poche mole- 
cole di RNA a doppio filamento per cellula, erano sufficienti per reprimere la 
produzione di proteina suggerendo l’intervento di un processo catalitico o d’am- 
plificazione. 


L’RNAi può anche essere indotta in C. elegans mediante l’ingestione di RNA a 
doppio filamento. I piccoli vermi nutriti con cellule di E. coli in grado di esprimere 
specifiche molecole di RNA a doppio filamento, nel 40-80% dei casi mostravano il 
fenotipo specifico associato al silenziamento genico (Timmons, Court e Fire, 
2001). Il silenziamento da RNA è stato utilizzato ampiamente per analizzare la 
funzione dei geni in C. elegans. La facilità con cui il silenziamento può essere rea- 
lizzato e la sua generale efficienza lo ha reso un potente strumento per l’analisi dei 
geni. C. elegans ha sei cromosomi e praticamente tutti i geni su due cromosomi 
sono stati inattivati mediante RNAi (Gònczy er al., 2000; Fraser et al., 2000). Per 
molti geni il knock-out produce fenotipi sterili o letali-embrionali che rendono dif- 
ficili ulteriori studi, ma le specifiche funzioni di molti altri geni possono essere as- 
segnate sulla base di questo tipo di analisi (Kamath et al., 2003). 

Come per l’introduzione di RNA antisenso, le molecole di RNA a doppio fila- 
mento possono essere prodotte all’interno delle cellule piuttosto che introdurle in 


| 
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esse. Per esempio, nei tripanosomi, sono stati costruiti plasmidi ad integrazione in 
cui un gene del tripanosoma è sotto il controllo della tetraciclina e trascrive un 
frammento genico nell’orientazione testa-testa che produce una forcina di RNA a 
doppio filamento che a sua volta induce RNAi (Shi et a/., 2000). Inizialmente, si 
pensava che Il’ RNAi potesse essere limitata nei suoi scopi dato che l’espressione di 
RNA a doppio filamento nei mammiferi produceva una generale depressione della 
sintesi proteica piuttosto che un effetto gene-specifico (Hope, 2001). Tuttavia, si è 
successivamente osservato che l’espressione di RNA di lunghezza pari a 21 nu- 
cleotidi, denominati piccoli RNA inibitori (siRNA), appaiati in modo da avere 
estremità sporgenti al 3’- di due nucleotidi, aveva la capacità di reprimere l’espres- 
sione di geni specifici in cellule di mammifero (Elbashir et al., 2001). L'effetto re- 
pressivo dell’RNAi in cellule di mammifero non è così importante come quello che 
si osserva nelle mosche o nei vermi, ma 1’ RNAi offre grandi potenzialità per deter- 
minare la funzione dei geni in una varietà di organismi precedentemente intrattabili 
dal punto di vista genetico. 


Box 10.1 Il Meccanismo dell’RNAi 


Il meccanismo molecolare dell’interferenza da RNA non è ancora stato piena- 
mente compreso. Si è visto che l’RNAi è un fenomeno post-trascrizionale 
(Montgomery, Xu e Fire, 1998), ma in che modo funziona? L'espressione di 
RNA a doppio filamento induce la degradazione specifica dell’mRNA cui esso 
risulta complementare (Ngo et al., 1998) Ad esempio, in Drosophila, l’espres- 
sione di un RNA a doppio filamento di 540 nucleotidi, corrispondente al gene 
per la ciclina E (una componente critica del ciclo cellulare) induce l'arresto del 
ciclo cellulare e. la produzione di frammenti di RNA di 21-25 nucleotidi omo- 
loghi al gene per la ciclina E, sia al filamento senso che a quello antisenso 
(Hammond er al., 2000). La degradazione dell’RNA è ATP dipendente, non ri- 
chiede la presenza del corrispondente mRNA, ed è catalizzata da una nucleasi 
sequenza-specifica (Zamore et al., 2000). Attraverso analisi di comparazione 
genomica, i genomi di Drosophila e C.elegans contengono solo tre tipi di en- 
zimi con attività RNAsica specifica per il doppio filamento (Bernstein et al., 
2001). È stato dimostrato che uno di questi enzimi, denominato RNAsi III o 
Dicer, è responsabile dell’attività RNAi. L'eliminazione dell’attività Dicer delle 
cellule comporta, infatti, la perdita della capacità di silenziare i geni mediante 
RNAIi (Hutvagner et al., 2001). 

Le piccole molecole interferenti di RNA (siRNA) generate da RNA a dop- 
pio filamento agiscono come primer per trasformare I mRNA target in RNA a 
doppio filamento, che può quindi essere degradato per generare nuove molecole 
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Figura 10.8. | meccanismi dell’inibizione con RNA antisenso e dell’interferenza da RNA. L'aggiunta 
o l’espressione o di RNA antisenso (mostrato in verde) o di RNA a doppio filamento (mostrato in 
rosa) può provocare la degradazione di specifiche molecole di MRNA nelle cellule. 


di siRNA (Lipardi, Wei e Peterson, 2001). Un enzima RNA polimerasi RNA- 
dipendente potrebbe svolgere un ruolo nell’amplificazione dell’RNA a doppio 
filamento, ma questo deve essere ancora dimostrato sperimentalmente. Un mo- 
dello che descriva il meccanismo molecolare dell’ RNAi viene mostrato in Fi- 
gura 10.8 (Nishikura, 2001). L'introduzione della sequenza di RNA antisenso, 
mostrata in verde, e di una specifica molecola di mRNA, porta alla formazione 
di un ibrido di RNA a doppio filamento. L’azione di una RNA polimerasi 
RNA-dipendente (RdRp) produce una grossa molecola di RNA a doppio fila- 
mento che viene degradata nei frammenti da 21-23 nucleotidi dalla RNAsi Di- 
cer. Questi siRNA sono anche in grado di legarsi agli specifici mRNA da cui 
sono originariamente derivati. Quando sono legati all’mRNA, alcuni dei siRNA 
funzioneranno da stampo per RdRp che produrrà più siRNA (Hutvagner e Za- 
more, 2002). Il risultato netto di questo processo è che 1’ mRNA target viene ef- 
ficientemente degradato, sia perché partecipa alla produzione di siRNA, che at- 
traverso l’attivazione di un complesso di silenziamento indotto da RNA (RISC) 
che degraderà i duplex mRNA-siRNA (Martinez et al., 2002). 


Il meccanismo dell’RNAi è complesso (vedi Box 10.1) ma il suo ruolo naturale 
pare essersi evoluto per proteggere le cellule da trasposoni e virus che producono 
RNA a doppio filamento durante il loro processo di replicazione. Naturalmente, ci 
sono molti tipi di RNA a doppio filamento che si possono trovare normalmente 
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nelle cellule, ad esempio come parte dello spliceosoma. Questi, tuttavia, non indu- 
cono RNAI, forse perché questo RNA a doppio filamento è anche associato a pro- 
teine cellulari. Nelle piante il silenziamento da RNA può essere utilizzato come 
meccanismo di difesa contro le infezioni virali. I virus contenenti genomi a RNA 
sono forti induttori del silenziamento da RNA dato che durante la replicazione si 
forma RNA a doppio filamento. Ancora, 1’ RNAi può conferire immunità contro vi- 
rus strettamente correlati. Come precedentemente discusso, un segnale di silenzia- 
mento mobile (probabilmente una molecola di RNA a doppio filamento) può 
diffondersi tra le cellule nelle piante per conferire immunità virale. Si pensa che al- 
cuni virus siano in grado di fronteggiare il silenziamento da RNA diffondendosi ra- 
pidamente in tutta la pianta (Voinner, 2001). 


10.5 Screening del doppio ibrido su scala genomica 


Abbiamo già discusso l’utilizzo degli screening basati sul doppio ibrido per rile- 
vare specifiche interazioni tra proteine e clonare potenziali partner di interazione 
da librerie di cDNA (Capitolo 6). Per condurre questo tipo di analisi su scala geno- 
mica è necessario che ogni possibile esca (bait) (Fig. 6.8) sia testata contro ogni 
potenziale preda (prey) di un organismo in modo da ottenere una mappa completa 
delle possibili interazioni proteina-proteina per l’organismo in esame. Per giunta, 
se è stato identificato ogni possibile gene all’interno del genoma tramite la deter- 
minazione della sua sequenza, non vi è più la necessità di costruire ed effettuare lo 
screening di una complessa libreria di cONA. Un approccio di gran lunga più siste- 
matico consiste nel clonare ed analizzare individualmente ogni gene codificante 
per proteina all’interno del genoma. Così, nel caso di un saggio del doppio ibrido, 
ogni potenziale gene codificante per proteine dovrà essere fuso, nella corretta fase 
di lettura, alla sequenza codificante un dominio di attivazione trascrizionale. Nel 
caso del lievito, devono essere costruiti circa 6.000 plasmidi individuali in modo da 
testare tutte le possibili esche. Questo non è affatto un compito banale. Il clonaggio 
su questa scala può essere tuttavia effettuato attraverso l'amplificazione mediante 
PCR dei -6.000 geni di lievito a partire dal DNA genomico, utilizzando un set di 
primer specifici per ogni gene (Fig. 10.9). I primer devono essere costruiti in modo 
tale che ciascuno dei primer diretti (forward) abbia una coda comune al 5°- di 20 
nucleotidi, e ciascuno dei primer complementari (reverse) abbia una coda comune 
differente. Le code in comune possono quindi essere utilizzate come siti di legame 
per i primer di un secondo round di PCR impiegando lo stesso set di primer per 
tutti i -6.000 prodotti di PCR (Uetz et al., 2000). Durante il secondo round di 
PCR, ciascuno dei prodotti amplificati ha una sequenza comune di 50 bp aggiunta 
alle estremità 5°- e una differente sequenza comune di 50 bp attaccata alle estre- 
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Figura 10.9. La costruzione di plasmidi in grado di produrre differenti proteine preda per l’impiego in 
saggi del doppio ibrido. | geni vengono amplificati usando primer che contengono sequenze comuni 
alle estremità 5’. Questo ne consente la ri-amplificazione con una seconda coppia di primer in modo 
che tutti i geni abbiano un tag alle loro estremità 5’ e 3’ (Hudson et al., 1997). | geni dotati di tag ven- 
gono quindi miscelati con un plasmide linearizzato e trasformati in lievito. La ricombinazione omologa 
tra il plasmide e il prodotto di PCR avviene all’interno della cellula di lievito mediante appaiamento 
complementare tra il tag e le estremità del plasmide lineare. Questo produce l'inserzione del prodotto 
di PCR nel plasmide e la conseguente produzione della proteina preda. 
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mità 3’-. I prodotti di PCR vengono quindi miscelati con un plasmide linearizzato 
che contiene queste sequenze comuni alle sue estremità e poi trasformati in cellule 
di lievito. All’interno del lievito, le sequenze comuni del prodotto di PCR subi- 
scono ricombinazione omologa con il plasmide lineare per riformare un plasmide 
circolare che successivamente può essere replicato. Questo processo ha come risul- 
tato l'inserimento di ogni prodotto di PCR, e del gene codificato, in un plasmide di 
lievito senza la necessità di ulteriori manipolazioni del DNA. Sistemi simili di clo- 
naggio ligazione-indipendente sono stati messi a punto per la costruzione di pla- 
smidi in cellule di E. coli (Donahue, Turczyk e Jarrel, 2002). 

Una volta costruiti, i -6.000 ceppi di lievito, ciascuno in grado di produrre un 
differente dominio di fusione per l'attivazione trascrizionale (preda), possono essere 
incrociati con un singolo ceppo di lievito in grado di esprimere una singola esca 
(fusa ad un dominio di legame del DNA) in modo da creare una serie di cellule di- 
ploidi di lievito in grado di produrre una singola esca e tutte le possibili prede. Le 
cellule diploidi possono essere cresciute in piccole colture nei pozzetti di una micro- 
piastra nelle condizioni in cui solo l’interazione tra l’esca e la preda potrà permet- 
tere la crescita cellulare. In questo modo sarà possibile identificare in un unico espe- 
rimento tutti i possibili partner di interazione di una specifica esca (Fig. 10.10). I 
dati ottenuti ripetendo il saggio con differenti esche può portare alla costruzione 
della mappa completa delle interazioni proteina-proteina Uetz et a/., 2000). Finora, 
mappe di questo tipo sono state realizzate solo per le interazioni proteiche all’in- 
terno di cellule di lievito, ma sono anche emerse importanti informazioni sul nu- 
mero di distinti complessi proteici presenti all’interno della cellula. Molti dei pro- 
blemi del saggio del doppio ibrido già discussi nel Capitolo 6 si ripresentano anche 
in questo caso. 


10.6 Array per l’identificazione di proteine 


La presenza o l’assenza di una proteina all’interno di una specifica cellula, piutto- 
sto che essere basata sull’osservazione della presenza del corrispondente trascritto 
di RNA, potrebbe essere determinata in modo più appropriato rivelando diretta- 
mete la presenza della proteina. Forse, un approccio ancora più stringente potrebbe 
essere quello di rilevare l’attività delle singole proteine prodotte all’interno di una 
cellula (Kodadek, 2002). Lo sviluppo di saggi diretti delle proteine, come per le 
loro controparti sui microarray, è ancora ai primi passi. Sono tuttavia disponibili al- 
cuni chip per il riconoscimento di proteine (Fung et al., 2001). Questi sono costi- 
tuiti da ligandi, ad es. anticorpi o piccole molecole, immobilizzati su una superfi- 
cie, ma sempre in grado di legarsi in modo specifico alle proteine. Gli estratti cel- 
lulari vengono quindi posti in contatto con la superficie del chip, e dopo un oppor- 
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Figura 10.10. Saggio del doppio ibrido su scala genomica per l’identificazione delle interazioni pro- 
teina-proteina. Cellule di lievito, tutte in grado di produrre una singola proteina esca (in questo caso 
Pcf11p fusa al dominio di legame al DNA di Gal4p) sono state incrociate con 6.000 differenti tipi di 
cellule di lievito, ciascuna in grado di esprimere una differente proteina preda (fusa al dominio di atti- î 
vazione trascrizionale di Gal4p) e fatte crescere in micropiastre a 384 pozzetti. La crescità potrà av- 
venire solo a condizione che si realizzi un'interazione tra l’esca e la preda che, a sua volta, attiverà Ù 
l'espressione di un gene reporter. | geni mostrati nel pannello in basso sono quelli che esprimono Il 
proteine preda in grado di interagire con la proteina esca Pcf11p. IMmagine gentilmente concessa da | 
Stan Fields (University of Washington) ristampata previa autorizzazione di Nature (Uetz et a/., 2000) 
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tuno lavaggio, le proteine legate possono essere rilevate mediante analisi di spettro- 
metria di massa. 


10.7 Genomica strutturale | 


L'importanza della biologia strutturale per il progresso nella comprensione dei pro- | 
cessi molecolari non può essere trascurata. La capacità di visualizzare le molecole 
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proteiche nelle tre dimensioni ad alta risoluzione fornisce informazioni cruciali sul 
loro meccanismo d’azione a livello molecolare che altrimenti non sarebbe possibile 
ottenere. Le strutture ad elevata risoluzione vengono normalmente ottenute attra- 
verso due diversi metodi, la cristallografia a raggi X o la risonanza magnetica nu- 
cleare (NMR). In entrambi i casi, la determinazione della struttura risulta lunga e 
laboriosa. Le prime strutture proteiche ad essere risolte dalla cristallografia a raggi 
X furono quelle della mioglobina e dell’emoglobina. Max Perutz cominciò a lavo- 
rare sulla struttura dell’emoglobina (peso molecolare 67 kDa) nel 1936 e final- 
mente ne risolse la struttura nel 1959, pubblicandola nel 1960 (Perutz et a/., 1960). 
Oggi, la determinazione della struttura per mezzo della cristallografia a raggi X è 
di gran lunga più veloce, soprattutto per i progressi nella capacità di calcolo, ma ri- 
mane ancora essenzialmente basata su molte delle tecniche pionieristicamente 
messe a punto da Perutz e colleghi. In generale, sia la cristallografia a raggi X che 
INMR dipendono dalla disponibilità di grandi quantità di proteina ad elevato 
grado di purezza. Tradizionalmente, le strutture delle proteine sono state risolte una 
per volta, e con cadenza sporadica. Se qualcuno, lavorando su una proteina biologi- 
camente interessante riusciva a produrne grandi quantità, si cimentava poi nella sua 
analisi strutturale. La disponibilità delle sequenze genomiche, tuttavia, ha aperto 
un percorso alternativo per la soluzione della struttura delle proteine, basato esclu- 
sivamente sulla conoscenza della sequenza di DNA (Fig. 10.11). Questo approccio 
viene ora utilizzato per una varietà di organismi il cui genoma è stato completa- 
mente sequenziato. Analisi di questo tipo sono state rese possibili dall’automazione 
di quasi tutte le fasi del processo di determinazione strutturale mostrato in Fig. 
10.11. Ad esempio, 1376 dei 1877 geni predetti (73%) nel batterio termofilico 
Thermotoga maritime sono stati clonati in un vettore d’espressione di £. coli in 
modo che la proteina prodotta contenga un tag di poli-istidina (Capitolo 8). 542 di 
questi cloni hanno prodotto una quantità sufficiente di proteina purificata per po- 
terne tentare la cristallizzazione, e condizioni soddisfacienti per la cristallizzazione 
sono state ottenute per 432 proteine, che rappresentano il 23% del proteoma di 7. 
maritime (Lesley et al., 2002). È probabile che non da tutti i cristalli si riesca ad 
ottenere la struttura della proteina, con una ulteriore diminuzione della percentuale 
suddetta. I dati qui menzionati mostrano che il maggiore intralcio al successo della 
determinazione della struttura è rappresentato dalla disponibilità di proteina purifi- 
cata. Molte proteine prodotte utilizzando metodologie generali come questa risulte- 
ranno insolubili e quindi non adatte per l’analisi strutturale. Le proteine legate alla 
membrana o che risultino dannose per la crescita di E. coli possono essere difficili 
da produrre. Un approccio alternativo è quello di produrre in vitro le proteine per 
l’analisi strutturale in modo da eliminare i problemi legati alla crescita cellulare. 
Sistemi per la trascrizione e la traduzione in vitro sono impiegati ormai da molti 
anni. In generale essi operano utilizzando un DNA plasmidico in cui il gene che 
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Figura 10.11. Genomica strutturale per determinare la struttura delle proteine solo sulla base della 
conoscenza della sequenza dei geni. La maggior parte delle strategie di genomica strutturale si 
basano o sulla cristallografia a raggi X o su NMR, non su entrambe le tecniche. 
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deve essere espresso viene clonato a valle di un sito promotore in grado di legare la 
RNA polimerasi, ad es. T7 o SP6. Il plasmide viene quindi miscelato con una 
forma ricombinante della polimerasi per produrre RNA. L’RNA viene poi tradotto 
in vitro usando un lisato cellulare, derivato da E. coli o da reticolociti di coniglio 
(Turner e Foster, 1998). Questi sistemi presentano delle limitazioni per la quantità 
di proteina che sono in grado di produrre e normalmente non danno rese sufficienti 
per l’analisi strutturale. Sono però stati recentemente sviluppati dei sistemi accop- 
piati per la trascrizione/traduzione, in cui la reazione viene effettuata in una camera 
separata dai substrati e le componenti energetiche necessarie per sostenere la rea- 
zione fornite attraverso una membrana semipermeabile. La trascrizione e la tradu- 
zione possono aver luogo simultaneamente nella camera di reazione, mentre i sot- 
toprodotti della reazione con attività inibitoria vengono diluiti per diffusione attra- 
verso la membrana nella camera di alimentazione. Questo approccio permette di 
ottenere livelli elevati d’espressione della proteina, consentendo alla sintesi pro- 
teica di proseguire per tempi lunghi, oltre le 24 h (Martin et al., 2001). 

La genomica strutturale promette di accrescere grandemente le nostre cono- 
scenze sui tipi di arrangiamenti strutturali che i polipeptidi sono in grado di adot- 
tare. Il pericolo è che vengano risolte solo le strutture di proteine facili da cristal- 
lizzare, o sufficientemente piccole da potere essere studiate mediante NMR. Ulte- 
riori sforzi saranno necessari per studiare proteine biologicamente interessanti, ma 
strutturalmente difficili da analizzare. 


Modificazioni genetiche 
delle piante 


Concetti chiave 


+ Le piante, per la loro rilevanza commerciale, sono bersagli importanti 
per introdurre modificazioni genetiche 


+ Geni possono essere inseriti in una varietà di piante dicotiledoni, mo- 
dificando il plasmide Ti proveniente da Agrobacterium tumefaciensis, 
diventando genoma delle piante 


+ La trasformazione del genoma del cloroplasto permette l’inserzione 
di geni eterologhi in loci specifici e non causa il trasferimento del 
gene eterologo nel polline 


+ È in corso un dibattito molto acceso sulle prospettive e pericoli di 
piante geneticamente modificate (OGM) 


Nei capitoli precedenti, abbiamo discusso la manipolazione del DNA in procarioti, 
come £. coli, o in eucarioti unicellulari come il lievito. Abbiamo anche visto che 
DNA proveniente da un organismo può essere introdotto in un organismo diverso e, 
purché siano mantenuti certi criteri, può funzionare nel nuovo ospite. La manipola- 
zione dei geni negli eucarioti multicellulari offre la possibilità di alterare l’espres- 
sione genica di un intero organismo. 


11.1 Clonaggio nelle piante 


L’ingegneria genetica applicata alle piante apre possibilità molto interessanti. Per 
esempio, è possibile alterare la composizione proteica delle piante aumentandone 
le proprietà nutrizionali, rendendole capaci di crescere in condizioni ambientali 
difficili o facendo loro acquisire un aspetto più attraente per il consumatore. Tutto 
ciò ha, ovviamente, importanti ricadute economiche e discuteremo alcuni di questi 
aspetti alla fine del capitolo. Prima di tutto è, però, importante capire le differenze 
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tra cellule animali e vegetali e comprendere i meccanismi che possono essere uti- 
lizzati per trasferire in tali cellule un gene esogeno (chiamato transgene). Una 
delle differenze maggiori tra piante ed animali consiste nel fatto che le piante man- 
tengono un certo grado di plasticità. Infatti, una cellula vegetale, in appropriate 
condizioni di coltura, può mantenere la capacità di rigenerare una nuova pianta 
completa. Questa capacità si è rivelata essenziale per la produzione di piante inge- 
gnerizzate, dal momento che singole cellule in cultura possono essere manipolate e 
poi usate per riformare una pianta completa. Recentemente, sono anche state svi- 
luppate una serie di tecniche di trasformazione in planta con cui embrioni vegetali, 
semi o anche polline sono resi in grado di ricevere DNA eterologo (Touraev et al., 
ISF 


11.1.1 Agrobacterium tumefaciens 


Le piante non contengono alcun plasmide naturale. Tuttavia, un plasmide batterico 
(il plasmide tumorigenico Ti del microrganismo del suolo Agrobacterium tumefa- 
ciens) è stato ampiamente usato per introdurre geni esogeni nelle cellule vegetali. 
A. tumefaciens è responsabile di una malattia nota come crown gall diffusa in 
molte piante dicotiledoni, quali il pomodoro, tabacco, patata, pisello, fagiolo etc. 
(Fig. 11.1). Una lesione sullo stelo della pianta permette l’invasione da parte del 
batterio ed una proliferazione di tipo tumorale del tessuto dello stelo. Un plasmide 
presente all’interno del batterio porta i geni responsabili delle formazioni tumorali 
a corona (galle) (Zaenen et al., 1974; Van Larebeke et al., 1974). Il plasmide Ti in 
grado d’indurre il tumore della pianta è una molecola di DNA molto grande (circa 
200 kbp) che contiene i numerosi geni richiesti per il processo infettivo (Fig. 11.2) 
(Suzuki et al., 2000). Dopo l'infezione, parte del plasmide Ti, chiamato il T-DNA, 
si integra, in modo apparentemente casuale, all’interno del genoma della pianta at- 
traverso meccanismi di ricombinazione non-omologa. Il T-DNA (che ha una di- 
mensione di circa 23 kbp) contiene, oltre ai geni responsabili per l'insorgenza del 
tumore nella pianta (geni che controllano la produzione di ormoni vegetali, quali 
l’auxina e la citochina, che stimolano la crescita e la divisione cellulare), anche i 
geni responsabili per la sintesi delle opine, molecole derivate dagli amino acidi 
(Fig. 11.2). Vari plasmidi Ti inducono la sintesi di opine diverse. Le opine prodotte 
dalla pianta infettata, quali la nopalina che si forma attraverso la modificazione di 
arginina e &-cheto-glutarato, possono essere usate da cellule di A. tumefaciens 
come unica sorgente di carbonio e di energia. Altri batteri presenti nel suolo sono 
incapaci di metabolizzare le opine e, quindi, è possibile che queste molecole pos- 
sano promuovere la crescita di altre cellule di A. tumefaciens e fornire loro un van- 
taggio selettivo rispetto ad altri microrganismi presenti nel terreno. All’interno del 
plasmide Ti, il T-DNA è fiancheggiato da 2 ripetizioni dirette imperfette di 25 bp, 
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Figura 11.1. Formazioni tumorali a corona (galle) che si formano nello stelo di una pianta di patata 
in seguito all’infezione da parte di Agrobacterium tumefaciens. Immagine gentilmente concessa dal 
Prof. Paul Hooyakaas (Università di Leiden, Olanda). 


note come le sequenze confine di destra e di sinistra. Queste sequenze sono neces- 
sarie per l'integrazione del T-DNA nel genoma della pianta (Yadav er a/., 1982), ed 
ogni sequenza localizzata tra di loro verrà integrata durante il meccanismo di ri- 
combinazione. Una volta integrato, il T-DNA viene stabilmente mantenuto nel ge- 
noma e trasmesso alle cellule figlie. 

Oltre al T-DNA, il plasmide Ti contiene i geni necessari per l’utilizzazione 
delle opine, circa 35 geni richiesti per la virulenza (vir) ed un’origine di replica- 
zione (ori) di A. tumefaciens (Fig. 11.3). Poiché il T-DNA viene integrato nel ge- 
noma della pianta, il plasmide Ti rappresenta un eccellente meccanismo per intro- 
durre geni eterologhi e/o geni modificati all’interno di cellule vegetali. Per prima 
cosa, è necessario che il T-DNA sia, per così dire, “disarmato”, in modo da perdere 
la capacità d’indurre tumori che sarebbero un impedimento negli esperimenti di 
clonaggio genico. Per ottenere ciò, i geni che codificano per la produzione di 
auxina e citochina sono semplicemente rimossi dal frammento del T-DNA (Zam- 
bryski et al., 1983). Del DNA esogeno può essere inserito tra le “sequenze con- 
fine” di destra e di sinistra, e questo verrà integrato nel genoma senza causare al- 
cun tumore. Abbiamo precedentemente discusso che molecole di DNA molto 
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Figura 11.2. Meccanismo con cui si creano le formazioni tumorali a corona (galle) causate dal bat- 
terio Agrobacterium tumefaciens. Una ferita sulla pianta sana permette l'infezione da parte di Agro- 
bacterium tumefaciens. Parte della molecola di DNA plasmidico presente nel batterio si inserisce nel 
DNA delle cellule della pianta determinando così l’inizio della formazione tumorale. Le cellule infet- 
tate iniziano poi a produrre opine (aminoacidi modificati come la nopalina mostrata in figura) che 
sono usate da Agrobacterium come sorgente di metaboliti. 
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Figura 11.3. Il plasmide Ti presente in Agrobacterium tumefaciens. Il DNA contenuto tra i confini 
destro e sinistro viene integrato nel genoma della pianta. 
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grandi sono difficili da manipolare in vitro (Capitolo 3) e la dimensione del pla- 
smide Ti preclude l’utilizzo di procedure di clonaggio semplici. Due strategie sono, 
quindi, state sviluppate per inserire sequenze di DNA esogeno all’interno della re- 
gione del T-DNA: 


* Vettori di co-integrazione. L'inserzione di sequenze di DNA esogeno all’interno 
di un plasmide Ti si ottiene con la ricombinazione tra un piccolo vettore plasmi- 
dico (ad es. un vettore di E. coli) e un plasmide Ti all’interno di cellule di A. tu- 
mefaciens. La ricombinazione avviene utilizzando sequenze omologhe di DNA 
presenti in entrambi i plasmidi (Matzke e Chilton, 1981). 


* Vettori binari. Per essere integrato nel genoma della pianta, il T-DNA non neces- 
sita di essere fisicamente associato ai geni che causano la virulenza (Bevan, 
1984). Il T-DNA “disarmato” può, quindi, essere introdotto in cellule di A. tume- 
faciens che posseggono il plasmide Ti con tutti i geni che causano la virulenza, 
ma da cui il T-DNA è stato rimosso. Le proteine che determinano la virulenza 
conferiscono tutte le funzioni richieste per integrare il T-DNA nel genoma della 
pianta. 


La trasformazione di cellule vegetali usando plasmidi Ti modificati di A. tumefa- 
ciens richiede sistemi di selezione per riconoscere le cellule trasformate dalle al- 
tre, analogamente a quanto è necessario fare per trasformare cellule di E. coli (Ca- 
pitolo 2). Molecole di T-DNA che non sono più tumorigeniche contengono ancora 
tutti i geni che codificano per la sintesi delle opine e, quindi, il riconoscimento dei 
trasformanti potrebbe essere fatto misurando la loro produzione, ma ciò è tecnica- 
mente difficile. Alla maggior parte dei vettori oggi utilizzati è, quindi, aggiunto un 
gene marcatore selettivo proprio per permettere il facile riconoscimento dei trasfor- 
manti. Il più utilizzato è il marcatore che conferisce la resistenza alla kanamicina 
(Capitolo 3), ma possono anche essere utilizzati altri geni che conferiscono resi- 
stenza ad altri antibiotici o erbicidi. Per esempio il gene csr/-/ di Arabidopsis co- 
difica una forma dell’enzima acetolattato sintetasi che rende le piante resistenti ad 
erbicidi, quali il clorosulforone e sulfonurea (Haughn et al., 1988). Tuttavia, come 
verrà discusso in seguito, l’introduzione di geni che conferiscono svariate resi- 
stenze nelle piante ha suscitato grosse preoccupazioni riguardo alla loro diffusione 
nell’ambiente. 

La trasformazione di cellule vegetali utilizzando A. tumefaciens è di solito ese- 
guita prelevando dei piccoli dischi dalle foglie della pianta ed incubando il tessuto 
fogliare con A. tumefaciens ricombinante (Horsch et al., 1985). L'infezione batte- 
rica inizia sui bordi del disco dove si trovano le cellule vegetali che hanno subito 
danni durante il prelievo. Il disco fogliare viene poi trasferito in un terreno di col- 
tura che contiene alti livelli di citochine per indurre la formazione del germoglio, 
prima dell’incubazione con una miscela di kanamicina e ampicillina, due antibio- 
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tici che hanno, rispettivamente, la funzione di selezionare le cellule vegetali tra- 
sformate e di uccidere i batteri. Le cellule che sopravvivono a questo trattamento 
sono quindi utilizzate per rigenerare la pianta dalla coltura di tessuto dopo l’ag- 
giunta di ormoni vegetali. A. tumefaciens si è rivelato molto utile per inserire geni 
nelle piante (Hooyakaas, 1989), ma il suo utilizzo è limitato a quelle specie che 
possono essere infettate dal batterio. Piante monocotiledoni (come frumento, orzo, 
riso e mais) sono bersagli molto attraenti per diverse manipolazioni genetiche, ma, 
purtroppo, sono generalmente resistenti all’infezione da parte di A. tumefaciens, 
anche se non se ne conosce il motivo. È possibile che l’induzione della divisione 
cellulare, e la conseguente sintesi di DNA che si verifica come conseguenza della 
lesione nelle piante dicotiledoni, aiuti il processo d’integrazione. Lesioni esterne 
sulle piante monocotiledoni tendono a causare un processo di lignificazione. L’effi- 
cienza di trasformazione di piante di riso da parte di A. tumefaciens aumenta, però, 
drasticamente se nelle reazioni di trasformazione è incluso acteosiringone, un com- 
posto fenolico prodotto da piante dicotiledoni che sono state lesionate (Hiei et al., 
1994). Altre piante monocotiledoni sono state trasformate con buoni risultati 
usando A. tumefaciens in presenza di altre sostanze chimiche particolari o usando 
embrioni di pianta in cui la divisione cellulare sia sufficientemente rapida da per- 
mettere l’integrazione del T-DNA (Cheng et al., 1997). Un ulteriore problema che 
si riscontra con l’utilizzo di A. tumefaciens nella trasformazione è legato alla ne- 
cessità di dover rigenerare la pianta partendo da colture cellulari. La difficoltà con 
cui avviene questo evento dipende dalla specie vegetale e può rappresentare un 
ostacolo insormontabile per la generazione di piante transgeniche. 

Perché il DNA esogeno introdotto nella pianta possa essere espresso è necessa- 
rio che la sua espressione sia sotto il controllo di un promotore che funziona nelle 
piante. I promotori dei geni che codificano per la sintesi delle opine di A. tumefa- 
ciens sono stati molto utilizzati per generare alti livelli d'espressione del transgene 
in seguito a trattamenti che causano lesioni esterne (An, Costa e Ha, 1990). Il pro- 
motore del gene dell'RNA 35S del virus del mosaico del cavolfiore (CaMV) è in 
grado d’indurre alti livelli d’espressione del transgene in piante dicotiledoni 
(Rathus, Bower e Birch, 1993), ma è inattivo nelle monocotiledoni. Esistono anche 
dei promotori che sono in grado di indurre l’espressione del transgene in modo tes- 
suto-specifico. Ad esempio, promotori per le proteine di riserva del seme sono stati 
utilizzati per esprimere specificamente il gene d’interesse in questa parte della pianta 
(Shubert et al., 1994). Oltre all’efficienza di un certo promotore, una serie di altri 
fattori possono influenzare l’espressione del transgene. Ad esempio, l’espressione 
è più elevata se sequenze non-tradotte in posizione 5° ed un’introne sono incluse 
nel transgene insieme ad un sito di poliadenilazione all’estremità 3°-. L'espressione 
del transgene è fortemente influenzata anche dalla posizione in cui questo si è inte- 
grato all’interno del genoma, un fenomeno che è più o meno casuale, dato che av- 
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viene mediante meccanismi di ricombinazione non-omologa. Questa variabilità è 
chiamata anche effetto di posizione: in certe localizzazioni il transgene è espresso 
a livelli molto alti; in altre, il livello d’espressione è molto inferiore o addirittura 
assente (ad esempio nelle vicinanze dei telomeri). Infine, la casualità dell'evento 
d’integrazione fa sì che il transgene sia spesso inserito nel genoma in numerose co- 
pie, sia nella forma di ripetizioni in tandem nello stesso locus cromosomico, sia in 
posizioni sparse nel genoma. Questo fenomeno, invece che determinare un aumento 
nel livello d'espressione del transgene, può determinare l’effetto opposto, noto an- 
che come silenziamento del transgene (Plasterk e Ketting, 2000). Il meccanismo 
di silenziamento è molto complesso. In una eccellente dimostrazione del fenomeno, 
Garrick et al. (1998), hanno costruito un transgene costituito da copie ripetute dello 
stesso gene e ciascuna copia conteneva un sito /oxP (vedere Fig. 3.7). Se il tran- 
sgene contiene copie multiple la sua espressione è molto bassa, ma se nella cellula 
viene prodotta anche la ricombinasi Cre, che agendo a livello dei siti /oxP elimina 
tutte le copie del gene eccetto una, allora l’espressione diventa molto elevata. La ri- 
duzione del numero di copie del gene è associata ad una riduzione del livello di 
condensazione della cromatina e ad una riduzione del livello di metilazione del 
DNA in quella specifica regione del cromosoma, due fattori che influenzano il li- 
vello d’espressione genica. Sono stati fatti diversi tentativi per cercare di svilup- 
pare sistemi sperimentali in grado di favorire eventi d’integrazione attraverso mec- 
canismi di ricombinazione omologa, quali il sistema Cre/lox sopra citafo (Kumar e 
Fladung, 2001). Fino ad oggi, però, i risultati in tale direzione sono stati piuttosto 
deludenti. 


11.1.2 Trasformazione nucleare diretta 


Il numero piuttosto limitato di piante trasformabile mediante il sistema di A. tume- 
faciens ha portato alla ricerca di metodi alternativi per introdurre DNA in cellule 
vegetali. Tali metodi ricadono fondamentalmente in due categorie: 


(a) Trasformazione di protoplasti. Il protoplasto è una cellula priva della parete 
cellulare. Nelle piante, un protoplasto può essere generato trattando tessuti 
vegetali con pectinasi ed enzimi che degradano la cellulosa per rompere gli 
aggregati cellulari e digerire la parete cellulare. I protoplasti sono in grado 
di sintetizzare una nuova parete in circa 10 giorni, riprendere poi la divi- 
sione cellulare e, in condizioni appropriate, rigenerare una nuova pianta. 
Nello stadio di protoplasto, le cellule vegetali sono in grado d’introdurre 
DNA in seguito a trattamenti chimici specifici (Negrutiu et al., 1987), come 
elettroporazione (Shillito et al., 1985) o trattamento con liposomi (Hansen e 
Wright, 1999). Il DNA che viene inserito nella cellula con queste metodolo- 
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gie non è in grado di replicarsi autonomamente, ma può venire integrato a 
caso nel genoma attraverso meccanismi di ricombinazione non-omologa (Pa- 
szkowski et al., 1984). Se il DNA contiene dei marcatori selezionabili come la 
resistenza alla kanamicina, i trasformanti possono essere riconosciuti come de- 
scritto in precedenza. 


(b) Biolistica. Con il termine biolistica si intende l’utilizzo di piccole particelle di 
metallo (generalmente tungsteno o oro) coperte da DNA che vengono letteral- 
mente “sparate” all’interno delle cellule tramite opportuni strumenti, scariche 
elettriche o l’utilizzo di gas ad alta pressione (Finer, Finer e Ponappa, 1999). 
Tale metodologia è applicabile ad un ampio spettro di cellule vegetali. Il de- 
stino del DNA, una volta introdotte le particelle di metallo all’interno delle cel- 
lule, è complesso: di norma il DNA è inserito in copie ripetute in siti variabili e 
per lo più casuali nel genoma della pianta (Pawlowski e Somers, 1998). 


11.1.3 Vettori virali 


Le piante sono normalmente attaccabili da numerosi agenti virali. Abbiamo prece- 
dentemente discusso come i virus dei batteri (batteriofagi) siano in grado di intro- 
durre i loro geni nella cellula ospite (Capitolo 3). Due classi di virus delle piante 
sono stati utilizzati per introdurre DNA esogeno nelle piante. 


* Caulimovirus. Il genoma del virus del mosaico del cavolfiore (CaMV) è costi- 
tuito da una molecola di DNA circolare a doppio filamento di circa 8.000 bp e 
contiene $ geni (Hull e Shepperd, 1977). Il genoma è contenuto all’interno di un 
involucro proteico che, come per il batteriofago À, impone un limite alle dimen- 
sioni del DNA esogeno che può essere clonato nel genoma virale senza che que- 
sto perda la capacità di infettare le cellule (Fig. 11.4a). Infatti, la dimensione 
massima del DNA virale che può essere impacchettato nel virus è di 8.3 kbp 
(Daubert, Shepherd e Gardner, 1983). Anche eliminando 2 geni virali non essen- 
ziali per la riproduzione del virus, la dimensione massima di DNA che può es- 
sere inserita nel suo genoma è di circa 1 kbp, limitando, di fatto, l'utilizzo di 
questo virus come vettore di clonaggio. La replicazione dei caulimovirus richiede 
la formazione di intermedi ad RNA ed è abbastanza suscettibile ad errori replica- 
tivi (Hull, Covey e Maule, 1987). Inoltre, CaMV può infettare un numero limi- 
tato di specie vegetali: nonostante queste limitazioni, vettori CaMV sono stati 
spesso usati per introdurre geni di piccole dimensioni o frammenti di geni (De 
Zoeten et al., 1989). 


e Geminivirus. I geminivirus contengono molecole di DNA a singolo filamento 
che si replicano nel nucleo attraverso una forma replicativa a doppio filamento 
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Figura 11.4. Virus delle piante. (a) Virus del mosaico del cavolfiore. (b) Virus “streak” del mais, un 
membro della famiglia dei geminivirus. (c) Virus del mosaico del tabacco. Ciascuna immagine è 
ingrandita 300.000 volte è riprodotta dal sito web :http://iacr.bbsrc.uk/ppi/links/pplinks/virusems/ 
index.html 
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che, quando clonato, mantiene la capacità di infettare altre cellule (Fig. 11.4b). I 
geminivirus vengono distinti in 2 classi, a seconda che contengano una (mono- 
partito) o 2 (bipartito) molecole di DNA a singolo filamento (Scholthof, 
Scholthof e Jackson, 1996). La replicazione dei geminivirus è una tipica replica- 
zione DNA-dipendente e non prevede, come nel caso dei caulimovirus, un pro- 
cesso di trascrizione inversa che è abbastanza suscettibile ad errori. Questa pecu- 
liarità ha fatto ritenere che i geminivirus potessero comportarsi come dei vettori 
d’espressione relativamente stabili, e ciò era importante perchè i geminivirus in- 
fettano molte specie di cereali (Stanley, 1993). Purtroppo, però, i geminivirus su- 
biscono numerosi riarrangiamenti e delezioni durante il loro ciclo infettivo, limi- 
tandone, così, l’uso come vettori di clonaggio. 


La grande maggioranza dei virus vegetali possiede genomi ad RNA ed il loro uti- 
lizzo come vettore di clonaggio è quindi complicato. L’isolamento di cloni di 
cDNA corrispondenti all’intero genoma di virus ad RNA ne ha però permesso la 
manipolazione (Ahlquist e Janda, 1984). Il cDNA modificato può essere successi- 
vamente trascritto in vitro con RNA polimerasi ed il genoma ad RNA così modifi- 
cato re-introdotto nelle cellule vegetali. Ad esempio, il virus del mosaico del ta- 
bacco (Fig. 11.4c) ed il virus X della patata sono stati modificati per introdurre 
geni esogeni nelle piante (Zaitlin e Palukaitis, 2000). 


11.1.4 Trasformazione dei cloroplasti 


Negli ultimi anni, la trasformazione dei cloroplasti è diventata un'alternativa alla 
trasformazione nucleare (Fig. 11.5). Il cloroplasto, come anche il mitocondrio, pos- 
siede un proprio genoma. Per il cloroplasto si tratta di una molecola di DNA a dop- 
pio filamento che, nel modello di pianta dicotiledone Arabidopsis thaliana, è 
grande circa 155 kbp e codifica per 87 proteine (Sato e? al., 1999). I geni del cloro- 
plasto sono generalmente organizzati in operoni, come nei batteri. Questo permette 
l’inserzione di più geni esogeni nel cloroplasto che possono essere espressi da un 
unico trascritto policistronico. Il cloroplasto è altamente poliploide (cioè ciascun 
cloroplasto può contenere numerose molecole di DNA) e le cellule fotosintetiche 
possono contenere migliaia di cloroplasti. Ne deriva che l’espressione di geni in- 
trodotti nei cloroplasti può raggiungere livelli molto più alti di quella che si può ot- 
tenere nel nucleo. È importante ricordare che i cloroplasti non sono presenti nel 
polline e, quindi, la possibilità di diffondere geni esogeni inseriti nei cloroplasti 
non può verificarsi durante le procedure d’incrocio. 

A differenza di quanto descritto sino ad ora per il trasferimento di geni nelle 
piante, l’inserzione di DNA nel genoma del cloroplasto avviene attraverso mecca- 
nismi di ricombinazione omologa in siti ben definiti. Infatti, i geni esogeni che si 
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Figura 11.5. Trasformazione dei cloroplasti. (A) Piccoli frammenti di foglia sono bombardati biolisti- 
camente con frammenti di DNA contenenti il gene aadA che conferisce la resistenza alla spectinomi- 
cina, fiancheggiato alle estremità 5°- e 3'- da regioni di omologia con il DNA del cloroplasto. (B) Dopo 
4 settimane in terreno contenente spectinomicina, i frammenti fogliari sono sbiancati in seguito all’ini- 
bizione della sintesi proteica del cloroplasto. | cloroplasti che sono stati trasformati crescono inizial- 
mente come “calli” verdi indifferenziati, che, in presenza di appropriati ormoni, danno poi origine a 
germogli. (C) Frammenti di foglia spectinomicina-positivi sono trattati con spectinomicina e streptomi- 
cina: dato che il gene aadA conferisce un ampio spettro di resistenza ad antibiotici, tale trattamento 
riduce la possibilità che mutanti spectinomicina-resistenti possano originarsi in modo spontaneo. | 3 
frammenti fogliari che sono diventati bianchi in presenza di entrambi gli antibiotici (parte destra della 
piastra) sono spectinomicina-resistenti spontanei. (D) Dopo numerosi cicli di rigenerazione e sele- 
zione, si originano plantule transgeniche omogenee che possono dare origine a piante vere e pro- 
prie. Immagine gentilmente fornita dal Prof. Ralf Bock (Università di Munster, Germania) e riprodotta 
da Bock, 2001. 


vuole inserire nel genoma del cloroplasto devono essere fiancheggiati da sequenze 
omologhe al DNA del cloroplasto stesso (Staub e Maliga, 1992). Per ottenere una 
buona efficienza di trasformazione del cloroplasto, il gene esogeno deve contenere, 
sia in 5°- che in 3*-, regioni omologhe di almeno 400 bp. I geni del cloroplasto 
sono trascritti da promotori cloroplasto-specifici ed usano anche segnali di termi- 
nazione specifici. Per tale motivo, se si vuole esprimere un gene esogeno nel cloro- 
plasto è necessario clonarlo sotto il controllo di un promotore adatto e con i corretti 
segnali di terminazione. È inoltre necessario utilizzare opportuni marcatori di sele- 
zione per identificare le cellule trasformate. Normalmente si utilizza il marcatore 
aadA che conferisce una resistenza cloroplasto-specifica ad antibiotici di tipo ami- 
noglicoside, come la spectinomicina (Goldshmidt-Clermont, 1991). La spectinomi- 
cina è un inibitore della sintesi proteica nei procarioti ed anche nei cloroplasti, 
mentre ha un effetto molto limitato nelle cellule vegetali. Anche il gene che confe- 
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risce la resistenza alla kanamicina può essere utilizzato come marcatore selettivo; 
tuttavia, si preferisce utilizzare altri marcatori rispetto a quelli che conferiscono re- 
sistenza ad antibiotici per evitare il rischio di trasferirle a batteri che vivono nel ter- 
reno o in animali che si nutrono di piante. Uno dei metodi di selezione più comuni 
si basa sul gene che codifica per la betaina aldeide deidrogenasi (BADH). Questo 
gene codifica per un enzima che converte la aldeide betaina, una sostanza tossica, 
nella glicin-betaina, un derivato innocuo che può essere efficaciemente usato come 
marcatore di selezione (Daniell, Mathukumar e Lee, 2001). Alternativamente, i 
marcatori possono essere rimossi dopo la costruzione della pianta transgenica 
(Iamtham e Day, 2000). Ad esempio, il marcatore può venire fiancheggiato da se- 
quenze /oxP e successivamente eliminato dal genoma mediante attivazione della ri- 
combinasi Cre (Corneille ef al., 2001). 

La doppia membrana dei cloroplasti presenti nelle cellule vegetali rappresenta, 
però, un ostacolo difficile da superare per l'introduzione di molecole di DNA eso- 
gene. Tale barriera può essere superata utilizzando i metodi biolistici descritti pre- 
cedentemente (Svab, Hajdukiewicz e Maliga, 1990). In questo modo, però, in ogni 
cellula vegetale può essere inserito solo uno o pochi genomi di cloroplasto e ciò 
determina la produzione di cellule geneticamente instabili che contengono una mi- 
scela di cloroplasti normali e trasformati. In tal caso è necessario applicare una 
forte pressione selettiva (ad esempio alte concentrazioni di antibiotico) per 3-4 ge- 
nerazioni della pianta, per assicurare che le cellule contengano una popolazione 
uniforme di cloroplasti (Fig. 11.6). Tale procedura ha l’ovvio svantaggio di richie- 
dere tempi molto più lunghi. 

Molte proteine sono state prodotte in cellule vegetali utilizzando la trasforma- 
zione genetica dei cloroplasti. Tra queste possono essere citate proteine che confe- 
riscono resistenza a erbicidi, insetti o che proteggono da condizioni di siccità. An- 
che alcune proteine che hanno un utilizzo terapeutico sono state prodotte in questo 
modo, quali la somatotropina (un ormone della crescita che viene utilizzato nel 
trattamento del nanismo pituitario) che è stata espressa in cloroplasti di tabacco 
(Staub et al., 2000). La proteina viene prodotta a livelli molto alti e con la corretta 
conformazione tridimensionale. Sarebbe molto importante riuscire a produrre in 
piante commestibili proteine che possono essere utili per la salute. Ciò è già possi- 
bile, ma bisogna migliorare le nostre conoscenze sui meccanismi attraverso i quali 
la proteina prodotta nelle piante possa essere mantenuta nella sua forma attiva 
dopo essere stata ingerita. Dovrebbe anche essere possibile esprimere proteine ri- 
combinanti nei cloroplasti di patate e pomodori; piante di pomodoro in grado di 
esprimere il gene marcatore aadA sono già state prodotte e la proteina ricombi- 
nante si accumula sia nei frutti che nelle foglie (Ruf et a/., 2001). 

Un aspetto peculiare della manipolazione genetica dei cloroplasti consiste nella 
possibilità di esprimere più geni mediante l’utilizzo di operoni, mentre questo non 


11.1 CLONAGGIO NELLE PIANTE 353 


Trasformazione 
dei cloroplasti 


(e dei cloroplasti) sotto 
forte pressione selettiva 


| Divisione cellulare 


Ulteriori cicli di 
rigenerazione 
e selezione 


Figura 11.6. Selezione di cloroplasti transgenici omogenei. Le cellule vegetali possono contenere 
50-100 cloroplasti e ciascuno di questi può contenere 10-20 nucleoidi, ognuno dei quali contiene, a 
sua volta, 5-10 genomi di cloroplasto. Quindi, ciascuna cellula vegetale può contenere più di 10.000 
genomi di cloroplasto. La trasformazione modifica generalmente solo 1 di questi genomi dando così 
origine ad una popolazione non-omogenea che solo dopo molti cicli di rigenerazione e selezione si 
produrrà nella pianta una popolazione omogenea di cloroplasti transgenici (spesso chiamata omo- 
plasmica). Modificato da Bock, 2001. 


è possibile modificando il genoma nucleare della pianta, dato che ogni gene nel 
nucleo produce un singolo mRNA. L'espressione di più di un gene è possibile solo 
attraverso il trasferimento simultaneo nel genoma della pianta di più transgeni o 
tramite l’incrocio di piante ciascuna contenente un singolo transgene (Daniell e 
Dhingra, 2002). La possibilità di produrre messaggeri policistronici nei cloroplasti 


354 MODIFICAZIONI GENETICHE DELLE PIANTE 11 


ha permesso d’esprimere nel tabacco 3 geni dell’operone cry di Bacillus thuringen- 
sis (De Cosa et al., 2001). Discuteremo più avanti l’utilizzo del sistema cry di Ba- 
cillus thuringensis; comunque, tale approccio permette di produrre livelli elevatis- 
simi (oltre il 45% delle proteine solubili) di proteine che hanno attività contro in- 
setti dannosi. Inoltre, l'impossibilità che il gene o la proteina da esso codificata 
possano essere trasferiti nel polline elimina il pericolo di effetti secondari su insetti 
diversi da quello che si vuole eliminare. Quindi, la modificazione genetica dei clo- 
roplasti è uno dei mezzi più sicuri nelle tecniche di trasformazione delle piante e di 
grande interesse per l’industria biotecnologica (Maliga, 2002). 


11.2 Utilizzo commerciale di piante transgeniche 


Per migliaia di anni si è cercato di migliorare la produttività delle piante. Ad esem- 
pio, programmi selettivi d’incrocio sono stati portati avanti con i cereali per mi- 
gliorare le qualità nutrizionali, le rese ed ogni altro aspetto che ne potesse favorire 
la coltivazione ed il raccolto. L’ingegneria genetica permette ora di modificare le 
proprietà di una pianta in modo specifico e diretto. Alcuni esempi di piante geneti- 
camente modificate oggi disponibili in commercio sono riportati nella Tabella 11.1. 


11.2.1 Maturazione ritardata 


La maturazione è certamente un aspetto importante della commercializzazione 
della frutta, dato che frutti acerbi o troppo maturi non sono appetibili ed il tra- 


Tabella 11.1. Produzione commerciale di alcune piante transgeniche, da Birch, 1977 


Pianta e data Nome Ditta Nuova proprietà della pianta 
di produzione 


Pomodoro (1994) Flavr Savr Calgene Pomodoro più saporito e a lunga 
conservazione 

Pomodoro (1995) Zeneca Consistenza della pasta di 
pomodoro 

Soia Monsanto Resistenza all’erbicida 
glifosato 

Colza (rapa) Roundup Ready 

Cotone (1995-96) 

Zucca (1995) Freedom III Upjohn Resistenza a numerosi virus 

Cotone Bollgard Monsanto Produzione della tossina di 

Patata NewLeaf Bacillus thuringiensis che 


Mais (1996-97) YieldGuard conferisce resistenza a insetti 
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sporto di frutta matura può causarne il danneggiamento. Quest'ultimo aspetto è 
particolarmente rilevante per i pomodori. Le proteine codificate da numerosi geni 
influenzano il processo di maturazione. Ad esempio, l’enzima poligalacturonasi è 
coinvolto nel controllo della rottura progressiva dell’acido poligalacturonico, un 
componente della parete cellulare del pericarpo della frutta. L'azione dell'enzima è 
importante per la graduale maturazione del frutto. Se l’enzima agisce troppo a 
lungo, la parete cellulare del frutto diventa troppo soffice e marcisce. Quindi, se si 
riesce a ritardare l’azione dell’enzima, il frutto matura più lentamente e, ad esem- 
pio, i pomodori possono essere lasciati sulla pianta per tempi più lunghi aumen- 
tando la gradevolezza del loro sapore. Piante di pomodoro sono state genetica- 
mente modificate proprio per ottenere tale risultato, attraverso l'inserimento di se- 
quenze antisenso alla regione in 5°- del gene codificante per la poligalacturonasi. 
L'espressione delle sequenze antisenso era sotto il controllo del promotore 35$ del 
virus del mosaico del cavolfiore e tale costrutto era stato inserito nelle piante di po- 
modoro usando l’Agrobacterium (Smith et al., 1988). I pomodori transgenici così 
costruiti producono un livello ridotto (circa il 6%) di poligalacturonasi e possono 
essere conservati per tempi molto più lunghi prima di deteriorarsi. La tecnica del- 
l’RNA antisenso è stata utilizzata per ridurre l’espressione anche di geni richiesti 
per la sintesi dell’etilene, determinando, anche in questo caso, una maturazione ri- 
tardata (Fray e Grierson, 1993). 


11.2.2 Resistenza ad insetticidi 


Diverse specie di piante coltivate sono state geneticamente modificate per espri- 
mere un gene di Baci/lus thuringiensis il cui prodotto è tossico per certi insetti 
che vengono così uccisi se mangiano le piante transgeniche. Bacillus thuringien- 
sis è un batterio sporificante Gram-positivo, in grado di sintetizzare dei grossi 
cristalli citoplasmatici contenenti queste tossine insetticide. Differenti ceppi del 
batterio producono tossine diverse che uccidono specie diverse di insetti. I cri- 
stalli sono aggregati di una proteina di circa 130 kDa (Fig. 11.7) prodotta come 
una pro-tossina che deve essere attivata prima di diventare efficace. Il cristallo 
proteico è essenzialmente insolubile, e ciò lo rende poco tossico per l’uomo, per 
gli animali e per molte specie d’insetti. Tuttavia, il cristallo viene solubilizzato in 
condizioni riducenti e ad alto pH (più di 9.5), condizioni che si trovano normal- 
mente nell’intestino tenue di larve di lepidotteri (falene e farfalle). Una volta che 
il cristallo è stato solubilizzato nell’intestino dell’insetto, la pro-tossina viene ta- 
gliata da una proteasi presente nell’intestino, producendo così la tossina attiva di 
circa 60 kDa, chiamata d-endotossina. Questa si lega alle cellule epiteliali del- 
l’intestino, crea dei pori nella membrana e determina un equilibrio degli ioni. 
Come risultato l'intestino si immobilizza, le cellule epiteliali lisano, la larva 
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Figura 11.7. Struttura della $-endotossina di Bacillus thuringiensis (Li, Carrol e Ellar, 1991). 


smette di nutrirsi e il pH dell’intestino si abbassa equilibrandosi con il pH del san- 
gue. Il pH più basso così generatosi rende le spore capaci di germinare ed il batte- 
rio invade l'ospite causandone la morte per setticemia. Numerose specie di piante 
sono state geneticamente modificate per contenere una copia del gene cry1Ac di 
Bacillus thuringiensis che codifica per la pro-tossina (Tabella 11.1). Il gene è an- 
che stato espresso a livelli molto alti in cloroplasti di piante di pomodoro renden- 
dole così resistenti ad un ampio spettro di insetti parassitari (McBride er al., 
1995). Questo approccio è stato di notevole successo, anche se esiste la possibilità 
che l’esposizione continua degli insetti alla tossina possa indurre la selezione 
d’insetti resistenti. 


11.2.3 Resistenza ad erbicidi 


Diverse specie di piante coltivate sono state ingegnerizzate per resistere ad erbicidi, 
quali il glifosato (Fig. 11.8), un inibitore della sintesi degli aminoacidi aromatici 
sia nelle piante che nei batteri. Due approcci sperimentali sono stati usati per in- 
durre la resistenza all’erbicida in modo tale che possa distruggere le erbe infestanti 
senza danneggiare però la pianta. Nel primo caso, la proteina bersaglio dell’erbi- 
cida (EPSPSasi), viene sovra-espressa, così che la resistenza è dovuta alla sua 
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(a) 


Figura 11.8. Struttura dell’erbicida glifosato. (a) Glifosato, N-fosfonometil-glicina, viene venduto come 
un sale isopropilaminico con il nome commerciale di Roundup. È un inibitore della sintesi degli ami- 
noacidi aromatici, bloccando specificamente l'enzima 5-enolpirovilscichimato-3-fosfato, noto come 
EPSPSase. L’erbicida è assorbito dal fogliame, ma viene rapidamente trasportato nelle aree apicali 
della pianta ed inibisce la sintesi proteica. La morte normalmente è causata da disidratazione ed es- 
sicazione. (b) Interazione tra glifosato e EPSPSasi. Il sito attivo dell'enzima è localizzato nell’avvalla- 
mento tra i due “domini” dell'enzima. Il glifosato (blue) si lega vicino allo scichimato-3-fosfato (rosso) 
e sembra occupare il sito di legame del fosfoenol piruvato, il secondo substrato dell’EPSPasi, 
mimando così un intermedio del complesso ternario enzima-substrato (Schonbrunn et al., 2001). 


maggior concentrazione nella cellula (Shah et al., 1986). Alternativamente, viene 
fatta sintetizzare dalla pianta una versione mutata della EPSPSasi che è resistente 
all’erbicida (Stalker, Hiatt e Comai et al., 1985). Piante gifosato-resistenti, come il 
“Roundup Ready” commercializzato dalla Monsanto, hanno delle rese più alte col- 
legate all'eliminazione delle erbe infestanti. Tuttavia, bisogna continuare a valutare 
il pericolo potenziale di trasmettere la resistenza ad altre piante ed i possibili effetti 
dannosi derivanti da un utilizzo eccessivo di erbicidi (Gressel, 2000). Sono state ri- 
volte una serie di critiche a industrie che producono sia gli erbicidi che le piante ad 
essi resistenti. La possibile esistenza di una serie di conflitti d'interesse in tale set- 
tore va certamente tenuta sotto controllo. 


11.2.4 Resistenza ai virus 


Le infezioni di piante commerciali da parte di virus è la causa di grosse perdite 
commerciali. Il controllo delle infezioni virali si basa sul fatto che l’infezione di 
una pianta con un certo tipo di virus protegge la pianta stessa dall’infezione di un 
secondo virus correlato al primo. Ad esempio, l’espressione della proteina di rive- 
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stimento del virus del mosaico del tabacco non è sufficiente a causare la malattia, 
ma protegge la pianta dall’infezione successiva da parte del virus (Abel et al., 
1986). Analogamente, piante che esprimo le sequenze di RNA complementari alla 
regione codificante per la proteina di rivestimento del virus ed anche alle regioni 3° 
non-tradotte proteggono le piante dall’infezione (Powell et al., 1989). Il meccani- 
smo alla base di questa resistenza alla superinfezione non è chiaro e l’espressione 
della proteina di rivestimento in diversi tessuti produce livelli diversi di resistenza 
(Clarck et al., 1990). L'espressione di proteine virali nella pianta ha fatto nascere la 
preoccupazione che altri virus ancora in grado d’infettare la pianta, possano essere 
in grado d’acquisire nuove caratteristiche, ma non esiste alcuna evidenza sperimen- 
tale che ciò possa davvero accadere. 


11.2.5 Resistenza ai funghi 


Le piante sono state geneticamente modificate anche per diventare più resistenti ad 
infestazioni da parte di funghi, attraverso l’espressione di proteine antifungine 
nella pianta stessa. Ad esempio, piante di tabacco che esprimono costitutivamente 
il gene della chitinasi del fagiolo sotto il controllo del promotore 35S del virus del 
mosaico del cavolfiore sono capaci di crescere in terreni infestati dal fungo pato- 
geno Rhizoctonia solani o sviluppano i sintomi dell'infezione molto più tardi (Bro- 
glie et al., 1991). Le chitinasi idrolizzano la chitina, un polimero non ramificato di 
B (1-4) N-acetil-D-glucosamina (GIcNAc) che si trova nella parete cellulare di 
molti funghi. Un’alternativa è quella di trasferire alla pianta geni che riducono la 
virulenza dal patogeno (Melchers e Stuiver, 2000). 


11.2.6 La tecnologia “terminator” 


La tecnologia che probabilmente ha causato il maggior numero di discussioni nel- 
l’ambito del problema delle piante geneticamente modificate è la vendita, da parte 
delle ditte produttrici, di semi in grado di produrre una sola generazione di piante. 
Vale a dire che i semi venduti sono in grado di produrre piante che si sviluppano 
normalmente, ma i loro semi sono sterili. Questa tecnologia, nota come “termina- 
tor” fa sì che gli agricoltori non possano utilizzare l’anno successivo i semi da loro 
prodotti, ma debbano acquistare nuovi semi dalle ditte produttrici. Il fatto che esi- 
stano semi sterili in grado, però, di dare origine ad una pianta normale è dovuto al- 
l'inserimento di 3 geni nella pianta stessa: 


* il gene che codifica per il repressore della tetraciclina (TET£) sotto il controllo di 
un promotore costitutivo; 
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Figura 11.9. La tecnologia “terminator” per la produzione di semi sterili. Leggere il testo per ulteriori 
dettagli. 


* il gene che codifica la Cre ricombinasi, la cui espressione può essere inibita dal 
legame di TETR al suo promotore; 


e un gene che può essere espresso durante l’embriogenesi e che rende il seme ste- 
rile. Come mostrato in Fig. 11.9, il gene che codifica per una proteina in grado 
d’inattivare i ribosomi (RIP) viene controllato da un promotore che è attivo solo 
durante stadi tardivi dell’embriogenesi (/ea). Le proteine RIP sono enzimi della 
pianta che agiscono come potenti inibitori della sintesi proteica (Stirpe et al., 
1992), tagliando l’rRNA 28S a livello di uno specifico residuo di adenina. Questa 
modificazione irreversibile rende i ribosomi incapaci di legare fattori di tradu- 
zione, bloccando la sintesi proteica. 


La pianta transgenica è costruita in modo tale che il gene RIP non possa essere 
prodotto a causa di una sequenza di DNA introdotta al suo interno che è però fian- 
cheggiata da due siti di ricombinazione /oxP. La pianta è in grado di crescere nor- 
malmente e produce semi normali e fertili. La ditta produttrice tratta i semi con te- 
traciclina per inibire il legame del repressore della tetraciclina TETR al gene Cre 
che, quindi, può venire trascritto e la Cre ricombinasi prodotta è in grado di cata- 
lizzare l’excisione della sequenza di DNA che blocca il gene RIP. In tal modo, il 
seme è ancora capace di dare origine ad una pianta apparentemente normale, ma i 
semi che essa produce saranno sterili dato che nella tarda embriogenesi verrà 
espresso il gene RIP. I semi sterili mantengono tutti i valori nutrizionali della 
pianta normale, ma non sono capaci di dare origine a nuove piante. 


360 MODIFICAZIONI GENETICHE DELLE PIANTE 11 


La ditta produttrice di semi ha cercato di proteggere commercialmente tale me- 
todologia, ma l’opinione pubblica si è vivacemente opposta quando il brevetto è 
stato presentato nel 1998-1999. Il pericolo potenziale che le caratteristiche di 
piante “terminator” si potessero diffondere ad altre piante e la preoccupazione, 
reale o percepita, che ciò potesse determinare un controllo ingiustificato delle ditte 
produttrici di semi sugli agricoltori in particolar modo del terzo mondo, ha portato 
ad un blocco dell’implementazione di tale metodologia. 


11.3 Aspetti etici legati alle piante geneticamente modificate 


Una discussione dettagliata dei problemi etici legati allo sviluppo e produzione di 
piante geneticamente modificate (OGM) va oltre lo scopo di questo libro. La modi- 
ficazione delle caratteristiche di piante d’interesse agronomico è un processo che 
sta andando avanti da migliaia di anni e lo sviluppo delle tecnologie del DNA ri- 
combinante ha permesso e permetterà di ottenere ulteriori miglioramenti. Tuttavia, 
è necessario applicare tutti i controlli necessari affinché i prodotti commerciali così 
ottenuti siano sicuri per l’uomo, per gli animali e per l’ambiente. L'unico modo 
con cui questo può essere realisticamente ottenuto è tramite l’attenta progettazione 
ed analisi di sperimentazioni fatte sul campo in condizioni scientificamente con- 
trollate. 


Manipolazioni genetiche 
di cellule animali 


Concetti chiave 


+ Le cellule di eucarioti superiori sono abbastanza difficili da far cre- 
scere in coltura. La maggior parte delle cellule è in grado di produrre 
un numero limitato di generazioni prima di morire 


+ Si possono ottenere linee cellulari immortalizzate mediante trasfor- 
mazione con virus 


+ Si può inserire del DNA esogeno in cellule in coltura (transfezione) 
utilizzando una varietà di metodi chimico-fisici o virus 


La maggior parte delle cellule animali, diversamente dalle cellule vegetali, è già 
completamente differenziata o programmata a differenziarsi in modo specifico. 
Quindi, le cellule animali in cui si inserisce DNA esogeno difficilmente possono 
essere utilizzate per generare interi organismi. Un’eccezione a questa limitazione è 
la creazione di animali clonati a partire da cellule adulte, utilizzando le tecniche di 
trasferimento nucleare che verranno descritte in dettaglio nel Capitolo 13. In que- 
sto capitolo vengono, invece, presentate le metodologie che permettono d’intro- 
durre molecole di DNA all’interno di cellule somatiche e, in particolare, in cellule 
animali in coltura. 


12.1 Colture cellulari 


Si può effettuare una coltura di cellule animali partendo da un piccolo quantitativo 
di tessuto (di solito un campione di circa 2 mm?) che viene prelevato da un organo 
(pelle, fegato etc.) e posto in un contenitore sterile (normalmente una piastra di 
plastica). Il tessuto viene trattato con delle proteasi che degradano le impalcature 
proteiche che tengono unite le cellule così da separarle una dall’altra. Le cellule 
vengono poi trasferite in un’altra piastra che contiene del siero, in cui sono presenti 
i fattori di crescita che permettono alle cellule di dividersi. Le cellule primarie, 
prodotte in questo modo, proliferano con difficoltà e sono in grado di dividersi po- 
che volte prima di andare incontro a fenomeni di senescenza. Se si riesce a far pro- 
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liferare le cellule per numerose generazioni, si genera una linea cellulare seconda- 
ria. Le linee cellulari contengono molte cellule essenzialmente identiche e la mag- 
gior parte è in grado di dividersi 10-20 volte prima d’invecchiare. Poiché queste 
cellule alla fine finiscono per morire, vengono chiamate cellule mortali. Alcune li- 
nee cellulari, però, non vanno incontro a fenomeni di senescenza e vengono chia- 
mate linee immortali. Queste cellule sono anche definite ‘trasformate’: con tale ter- 
mine s’intende dire che sono cellule immortali neoplastiche. Esempi di linee cellu- 
lari immortalizzate sono: 


* le cellule HeLa, che derivano da una donna di colore di 31 anni (Henrietta 
Lacks), morta di cancro alla cervice uterina nel 1951; 


* cellule che provengono dall’ovaio del porcellino d’India (Chinese Hamster Ovary, 
CHO). 


Queste cellule possono diventare immortalizzate in conseguenza ad infezioni virali 
o altri cambiamenti genetici che aboliscono alcuni dei controlli che regolano la di- 
visione e la crescita cellulare. Nel campo delle colture cellulari, il termine trasfor- 
mazione indica questa perdita di controllo, piuttosto che, come abbiamo fatto fi- 
nora, la capacità di introdurre DNA esogeno all’interno di una cellula. L’inseri- 
mento di DNA esogeno all’interno di cellule di eucarioti superiori viene, invece, 
indicato con il termine transfezione. 


12.2 Transfezione di cellule animali 


L'inserimento di DNA esogeno all’interno delle cellule animali è un processo a 
due stadi, in cui il DNA viene prima trasferito all’interno della cellula (transfe- 
zione) e, successivamente, integrato nel genoma. È anche possibile generare linee 
cellulari stabili in cui il vettore utilizzato rimane nella cellula come elemento extra- 
cromosomico. Ad esempio, plasmidi che contengono l’antigene nucleare del virus 
Epstein-Barr (EBNA-1) insieme ad un’origine di replicazione (oriP) possono es- 
sere mantenuti come tali all’interno di alcune linee cellulari canine o di primati, ma 
non in linee cellulari di roditori (Yates et al., 1985). Tuttavia, nella maggior parte 
delle linee cellulari stabili il mantenimento ‘permanente’ del gene d’interesse, di- 
pende dal fatto che il DNA esogeno si integri all’interno del genoma della cellula 
attraverso meccanismi di ricombinazione non-omologa. La transfezione delle cel- 
lule è di gran lunga più efficiente che l'integrazione del DNA esogeno: quindi, la 
maggior parte delle cellule transfettate non contiene il DNA nella forma integrata. 
Il processo di transfezione viene definito stabile o transiente, in funzione del tempo 
in cui il DNA viene mantenuto all’interno della cellula. 


e Transfezione transiente. Se il DNA esogeno transfettato all’interno della cellula 
non viene integrato nel genoma e non contiene un’origine di replicazione ani- 
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male, la cellula sarà in grado di mantenerlo solo per un periodo di tempo molto 
limitato, prima di degradarlo o di perderlo durante le divisioni cellulari. Durante 
il periodo in cui riesce a rimanere all’interno della cellula, però, il DNA esogeno 
si comporta come ogni altra sequenza di DNA ed i geni in esso contenuti pos- 
sono essere espressi se sono sotto il controllo di un promotore adatto e la pro- 
teina codificata viene poi tradotta. Quindi, la transfezione transiente rappresenta 
un modo rapido per studiare geni esogeni ed analizzarne i prodotti all’interno 
delle cellule. Ad esempio, molti dei sistemi oggi utilizzati per lo studio dei pro- 
motori nel controllo dell’espressione genica, si basano su transfezioni transienti 
(raccolta delle cellule dopo 24-48 ore) di un gene reporter facilmente analizza- 
bile sotto il controllo del promotore in esame. Considerando che la maggior parte 
delle linee cellulari si divide ogni 16-24 ore circa, la raccolta delle cellule per 1 a- 
nalisi dei dati avviene in tempi relativamente brevi dopo la transfezione. I proto- 
colli sperimentali per le transfezioni transienti devono, di norma, essere ottimiz- 
zati a seconda della linea cellulare utilizzata, dato che l’efficienza con cui cia- 
scuna linea è in grado di ricevere al suo interno del DNA esogeno è variabile. 


e Transfezioni stabili. In tale caso, il DNA esogeno viene integrato all’interno del ge- 
noma della cellula transfettata in modo più o meno casuale e non rimane nel nu- 
cleo come molecola di DNA extra-cromosomica. Una volta integrato, il gene eso- 
geno viene replicato passivamente e può venire espresso, ammesso che sia sotto il 
controllo di opportuni elementi di regolazione trascrizionale. La transfezione sta- 
bile è l’unico modo con cui si riesce a produrre quantità apprezzabili di proteine ri- 
combinanti per un tempo prolungato. Esistono, però, notevoli difficoltà tecniche 
nel produrre linee cellulari transfettate stabilmente, per lo più connesse all’ineffi- 
cienza del processo d’integrazione del DNA. Di conseguenza, la produzione di una 
linea cellulare clonale può richiedere diversi mesi (Power e Meyer, 2000). 


La transfezione di cellule animali con geni provenienti da organismi eterologhi ri- 
sale ad oltre 40 anni fa (Szybalska e Szybalski, 1962). In quei primi esperimenti la 
capacità d’introdurre DNA in cellule animali era un evento rarissimo. Le cellule ani- 
mali sono circondate dalla membrana cellulare (membrana plasmatica), composta 
da un doppio strato di lipidi e da numerose proteine. La membrana cellulare è relati- 
vamente impermeabile e, in condizioni normali, permette il passaggio di un numero 
limitato di sostanze. Inoltre, nei tessuti, le cellule sono circondate dalla matrice ex- 
tra-cellulare (ECM), una miscela di proteine e proteoglicani, che svolgono funzioni 
importanti nei meccanismi di comunicazione ed adesione cellulare, ed, in genere, 
nella funzione dei tessuti. La maggior parte delle linee cellulari in coltura non pos- 
seggono, però, una ECM, per cui è più facile far entrare il DNA. Come abbiamo già 
discusso nel caso della trasformazione, l'efficienza del processo può essere aumen- 
tata notevolmente mediante una varietà di trattamenti che ora descriveremo. 
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12.2.1 Transfezione chimica 


L'efficienza con cui il DNA può entrare all’interno delle cellule aumenta di molto 
se il DNA è precipitato in presenza delle cellule stesse. Questo si può facilmente 
fare lavando le cellule in tampone fosfato, aggiungendo il DNA e, successiva- 
mente, del cloruro di calcio (Fig. 12.1). Si ritiene che con tale procedura il DNA 
precipitato si depositi sulla superficie delle cellule e ne sia così facilitata l’entrata 
attraverso meccanismi di endocitosi (Orrantia e Chang, 1990). Parte del DNA sarà 
poi in grado di entrare nel nucleo e di integrarsi nel genoma. Usando la procedura 
del calcio fosfato, l'efficienza di transfezione è piuttosto bassa (1-2%) (Graham e 
van der Eb, 1973), ma può essere aumentata se si utilizza DNA ad elevato grado di 
purezza e si procede in modo tale che il precipitato si formi lentamente (Chen e 
Okayama, 1988). 


12.2.2 Elettroporazione 


Abbiamo già discusso questa procedura quando abbiamo trattato la trasformazione 
batterica (Capitolo 2). L’elettroporazione è un metodo che funziona anche con le 
cellule animali (Wong e Neumann, 1982). È possibile, inoltre, ottimizzare i para- 
metri di elettroporazione per 1 diversi tipi di linee cellulari, variando l'intensità del 
campo elettrico e la durata del trattamento. 


Cellule che crescono in una piastra di coltura 
_____j 
Aggiungere 
DNA e CaCl, 
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} Lasciare che il precipitato 


si formi lentamente 


Transfezione 


Figura 12.1. La transfezione di cellule animali usando la precipitazione con fosfato di calcio 
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12.2.3 Transfezione mediata da liposomi 


I liposomi sono vescicole lipidiche che vengono utilizzate per trasportare varie 
molecole all’interno delle cellule. Nei liposomi classici le molecole che devono 
essere trasportate sono racchiuse all’interno di un doppio strato lipidico che ne 
favorisce l’entrata fondendosi con la membrana cellulare. Per trasportare gli 
acidi nucleici si usano lipidi cationici che portano cariche positive. I lipidi ca- 
tionici formano delle vescicole liposomiche unilamellari (Schaefer-Ridder, 
Wang e Hofschneider, 1982) che non incapsulano realmente il DNA all’interno 
del liposoma, ma formano un aggregato di vescicole lungo tutta la lunghezza 
della molecola di DNA, formando legami elettrostatici con le cariche negative 
presenti sul DNA stesso (Fig. 12.2). I liposomi cationici sono molto numerosi: 


(a) = 


Fusione dei liposomi con la 
membrana cellulare ed inserimento 
del DNA all’interno della cellula 


Figura 12.2. Introduzione di DNA nelle cellule tramite l’uso di liposomi cationici. (a) La struttura chi- 
mica del DOTMA (N-[1-(2,3-dioleiloxi)propil]}-N,N,N-trimetilammonio cloruro), un lipide cationico usato 
per la formazione dei liposomi (Felgner et al., 1987). (b) La struttura di un liposoma cationico. Le 
“teste” cariche positivamente si proiettano al di fuori di un “core” idrofobico formato da “code” di lipidi. 
(c) Un frammento di DNA viene circondato da liposomi cationici prima del suo inserimento all’interno 
della cellula in seguito alla fusione con la membrana cellulare 
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ad esempio, il DOTAP (N-1(-2,3-dioleoiloxi)propil)-N,N,N-trimetilammonio sol- 
fato) e il DOTMA (N-(1-(2,3-dioleoiloxi)propil)-N,N,N-trimetilammonio clo- 
ruro). Questi lipidi sono disponibili commercialmente e vengono venduti come 
agenti transfettanti (il secondo è noto come Lipofectin). I liposomi commerciali 
contengono anche dei lipidi neutri, come il DOPE o dioleoilfosfosfatidil-etanola- 
mina, che facilita la formazione dei liposomi e la fusione con la membrana cellu- 
lare. I liposomi cationici sono in grado d’interagire con le cariche negative della 
membrana in modo migliore rispetto ai liposomi privi di carica, facilitando il 
passaggio del DNA attraverso la membrana plasmatica (Fig. 12.2). Sembra, inol- 
tre, che le molecole trasportate all’interno della cellula attraverso l’utilizzo di li- 
posomi cationici riescano ad evitare la degradazione da parte degli endosomi, 
evento che rappresenta un altro ostacolo alla transfezione tramite endocitosi. La 
transfezione di DNA mediata da liposomi è molto utilizzata perché è tecnica- 
mente di facile esecuzione e molto riproducibile. 


12.2.4 Peptidi 


Un certo numero di peptidi è in grado di legarsi al DNA e di facilitarne l’entrata 
nelle cellule: tra questi, il tetrapeptide serina-prolina-lisina-lisina (localizzato nella 
porzione C-terminale dell’istone H1) facilita la transfezione del DNA (Schwartz et 
al., 1999). La carica positiva della catena laterale della lisina (vedi Appendice A) 
neutralizza le cariche negative dei fosfati nel DNA e facilita la condensazione di 
numerose molecole. Altri peptidi capaci di legare il DNA sono stati sintetizzati chi- 
micamente: ad esempio il peptide tirosina-lisina-alanina-(lisina)y-triptofano-lisina è 
molto efficiente nel formare complessi con il DNA (Gottschalk et al., 1996). I pep- 
tidi che legano il DNA possono essere accoppiati a dei ligandi tipo cellula-speci- 
fici, così che i complessi peptide-DNA possono essere veicolati su specifiche cel- 
lule che contengono il recettore in grado di riconoscere il ligando. Tale metodo è 
stato utilizzato per sintetizzare un peptide carico positivamnte in cui 16 residui di 
lisina erano legati al peptide arginina-glicina-acido aspartico (RGD). La sequenza 
RGD facilita il legame in vitro del complesso peptide-DNA al recettore dell’inte- 
grina in cellule Caco-2 (Harbottle et a/., 1998). Sono anche stati sintetizzati dei 
peptidi che facilitano il rilascio dei complessi peptide-DNA dagli endosomi dopo 
l’endocitosi. 


12.2.5 Trasferimento diretto del DNA 


Il DNA può essere iniettato direttamente nel nucleo di cellule in coltura (Capecchi, 
1980). Questo metodo è tecnicamente difficile ed abbastanza laborioso, dato che il 
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DNA esogeno deve essere iniettato nel nucleo in ogni singola cellula; ciò è, ovvia- 
mente, più facile se le cellule sono di grandi dimensioni. Per esempio, gli oociti del 
rospo africano Xenopus laevis, che possono essere raccolti in numero considere- 
vole dalle ovaie di rane adulte, hanno un diametro di circa 1 mm ed un nucleo 
molto grande. Il DNA o I'RNA che viene iniettato in tali nuclei, è normalmente 
espresso a mosaico (si esprime cioè solo in alcune cellule) durante lo sviluppo 
della rana (Melton, 1987). L'integrazione del DNA esogeno avviene molto rara- 
mente, ma l’espressione dei geni iniettati può essere seguita per molte genera- 
zioni cellulari. L'efficienza dell’integrazione del DNA iniettato varia enorme- 
mente nei diversi organismi. In certi tessuti di cellule animali, quali il muscolo e 
la pelle, spesso si ottengono livelli d'espressione del transgene molto alti (Wolff 
et al., 1990). Per esempio, pazienti che soffrono di una malattia genetica della 
pelle, nota come ictiosi lamellare, causata dalla perdita d’espressione del gene 
che codifica per la transglutaminasi 1 (TGasi 1), sono in grado di rigenerare par- 
zialmente cellule epidermiche dopo ripetute iniezioni di plasmidi che contengono 
il gene TGasil (Choate e Khavari, 1997). La ricostruzione dell’espressione del 
TGasil avviene in una determinata posizione dello strato epidermico. Tuttavia, 
analisi successive hanno rivelato che l’espressione del gene TGasil non era 
uniforme e, quindi, non in grado di correggere realmente le alterazioni istologi- 
che e funzionali della malattia. L’iniezione diretta di DNA è stata anche applicata 
a tentativi di terapia genica dei tumori, iniettando il DNA direttamente nelle cel- 
lule neoplastiche o in cellule muscolari per cercare di esprimere antigeni tumo- 
rali che potessero funzionare come vaccini. Sebbene sia dimostrato che l’inie- 
zione diretta di DNA possa portare all'espressione di geni, il livello finale d’e- 
spressione è certamente più basso di quello ottenibile con i liposomi. Riprende- 
remo più avanti il problema dell’iniezione diretta di DNA, quando parleremo 
della produzione di animali transgenici (Capitolo 13). 


12.3 Virus come vettori 


Dato che il DNA esogeno si integra in cellule animali con bassa efficienza e non 
esistono, in tali cellule, dei plasmidi extra-cromosomici naturali, i virus vengono 
molto spesso utilizzati come vettori per il trasferimento di geni. 


12.3.1 SV40 


Il primo vettore virale per cellule di mammifero era basato sull’uso di un virus 
della scimmia, chiamato SV40 (Hamer e Leder, 1979). SV40 è un virus tumorale 
di scimmia con DNA a doppio filamento che ha un genoma di 5243 bp. I suoi geni 
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Figura 12.3. Il genoma di SV40. SV40 ha due unità trascrizionali, la cui espressione è guidata da un 
promotore precoce e da uno tardivo. Entrambi i trascritti producono più proteine attraverso meccani- 
smi di splicing alternativo. Gli antigeni noti come “grande T” e “piccolo t” sono richiesti per la replica- 
zione virale, mentre le proteine VP formano il capside del virus. Le sequenze introniche che vengono 
rimosse durante lo splicing sono mostrate in rosso 


sono codificati su entrambi i filamenti della molecola, così che essi sono sovrappo- 
sti uno sull’altro (Fig. 12.3). L'infezione virale avviene di solito in cellule renali di 
scimmia, ma il virus è capace di infettare una varietà di cellule di mammifero e, a 
seconda dei casi, può andare incontro ad un ciclo litico o ad un ciclo lisogeno (Das 
e Niyogi, 1981). SV40 esprime due tipi di geni: 


* Geni precoci, espressi subito dopo l'infezione della cellula da parte del virus ed i 
cui prodotti sono richiesti per la replicazione del DNA virale. Tra questi ci sono 
due proteine chiamate il grande antigene T ed il piccolo antigene t. 


* Geni tardivi, espressi più tardi nel corso dell’infezione, codificano per le proteine 
del capside del virus e sono, quindi, richiesti per la produzione di nuove parti- 
celle virali. Questi geni sono sotto il controllo del maggiore promotore del SV40 
chiamato MLP (Major Late Promoter). 


Geni esogeni possono essere introdotti nel genoma di SV40 a sostituire geni pre- 
coci o geni tardivi. Se tale sostituzione causa, ad esempio, un difetto tardivo della 
replicazione, l’infezione può, comunque, procedere usando un virus SV40 “helper” 
difettivo nel gene precoce, ma tale da sostituire il gene tardivo nelle funzioni in 
trans. Come il batteriofago À, anche SV40 permette l’inserimento di DNA esogeno 
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di piccole dimensioni (Capitolo 3). Anche sostituendo geni pre-esistenti del virus, 
il frammento più grande di DNA che può essere inserito in SV40 è di circa 2300 
bp (Naim e Roth, 1994). 


12.3.2 Adenovirus 


Gli adenovirus sono responsabili, nell'uomo, del 25% dei comuni raffreddori. Ci 
sono molti tipi di adenovirus infettivi per l’uomo, ma tutti hanno forma icosaedrica 
(con una lunghezza variabile da 60 a 90 nm) e contengono molecole di DNA lineari 
a doppio filamento di circa 36 kbp (Fig. 12.4). Anche in questo caso, i geni del vi- 
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Figura 12.4. Adenovirus. (a) Immagine al microscopio elettronico di un adenovirus umano fecale 
(gentilmente concessa da Tony Oliver, IBMS London Region Virology Discussion Group). (b) Il 
genoma di adenovirus. È indicata la localizzazione approssimativa di alcuni geni precoci (E, 
early) e tardivi (L, late), la posizione del promotore MLP e di un sito (w) di circa 300 bp, necessa- 
rio per impacchettare il genoma virale nel capside. Ad entrambe le estremità del genoma ci sono 
sequenze invertite ripetute terminali (ITRs). Le ITRs vengono usate come origini di replicazione 
del DNA ed agiscono come zone d’assemblaggio dell'apparato replicativo per le proteine. Il ge- 
noma degli adenovirus codifica anche per diversi RNAs (VA RNAs) che rimangono associati al vi- 
rus e sono costitutivamente trascritti ad alti livelli usando 'PRNA polimerasi Ill. | VA RNAs sono. 
lunghi circa 160 nucleotidi, hanno un alto contenuto in GC e complesse strutture secondarie. Si 
pensa che possano servire per regolare i meccanismi di splicing o il controllo dell'efficienza tra- 
duzionale dei geni tardivi (Mathews, 1995) __ - - 
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rus sono distinti in precoci e tardivi, a seconda che la loro trascrizione avvenga 
prima o dopo la replicazione del DNA virale. La trascrizione è accompagnata da 
una serie complessa di eventi di “splicing”’ con quattro regioni precoci (da El a 
E4), richieste per la replicazione del DNA, ed un MLP, che controlla la trascrizione 
dei geni tardivi L1-L5, necessari per la produzione del capside (Logan e Schenk, 
1984). Il DNA del virus è in grado di replicarsi in molte linee cellulari di mammi- 
fero dopo transfezione. Il virus dà origine ad una progenie molto numerosa (fino a 
10° virioni per cellula infettata), rendendo così più semplice la purificazione di 
quantitativi consistenti di particelle virali selvatiche o ricombinanti. 


La maggior parte dei vettori derivati da adenovirus sono difettivi nel processo 
di replicazione, essendo stati privati del gene essenziale El e, spesso, anche del 
gene E3. Giacché tali virus sono difettivi nella replicazione, essi devono essere ri- 
combinati in linee cellulari che possono anche essere transfettate con DNA che 
contiene i geni El (ad es. la linea cellulare 293 umana embrionale di rene) per so- 
stituire la funzione E1 in trans (Graham et al., 1977). Questo tipo di vettore adeno- 
virale può contenere fino a 7 kbp di DNA esogeno. Per aumentare le dimensioni del 
DNA che può essere inserito, sono stati costruiti altri vettori che mancano anche dei 
geni endogeni E2 o F4 (oltre ad El e E3), ma le funzioni mancanti devono essere 
sempre fornite in trans dalla linea cellulare transfettata (Gorziglia et al., 1996). 


Gli adenovirus ricombinanti che portano DNA esogeno possono essere usati 
per produrre le proteine d’interesse in molti tipi di cellule, ma l’espressione dei 
geni esogeni è comunque transiente, dato che il DNA virale non si integra nella 
cellula ospite. La mancanza d’integrazione, tuttavia, può essere considerata un van- 
taggio quando i vettori adenovirali vengono utilizzati in esperimenti di terapia ge- 
nica. Inoltre, vettori adenovirali possono permettere di ottenere l’espressione di un 
gene in uno specifico tessuto, se il gene esogeno è messo sotto il controllo di un 
promotore o di un “enhancer” tessuto-specifico, come nel caso del promotore della 
catena leggera 1 della miosina (Shi, Wang e Worton, 1997) o il promotore SM22a 
delle cellule muscolari lisce (Kim et al., 1997), o attraverso una specifica localizza- 


zione in vivo (Rome et al., 1994). 

I vettori adenovirali sono molto efficienti nel processo di transfezione, potendo 
contenere inserti di DNA fino a 8 kbp ed infettare sia cellule proliferanti che cel- 
lule differenziate. Inoltre, non integrandosi nel genoma, non causano i fenomeni di 
mutagenesi collegati ad eventi d’integrazione casuale. Gli svantaggi dei vettori 
adenovirali sono dovuti al fatto che: 


* la loro espressione è transiente dato che il DNA virale non è integrato nell’ospite: 


* derivando da virus normalmente patogeni per l’uomo, l’introduzione dei vettori 
adenovirali in alcune cellule può essere impedita in vivo da una pre-sensibilizza- 
zione del sistema immunitario per rispondere ad un tipo di virus. 
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12.3.3 Virus associati agli adenovirus (AAV) 


Virus associati agli adenovirus (AAV) furono scoperti per la prima volta come dei 
contaminanti presenti in preparazioni di adenovirus (Atchison et al., 1965). Diver- 
samente dal loro nome, gli AAV non sono correlati agli adenovirus, ma apparten- 
gono alla famiglia dei parvovirus, con un genoma costituito da DNA a singolo fila- 
mento di circa 5000 nucleotidi. Il virus viene spesso individuato nelle tonsille del- 
l’uomo, anche se la sua presenza non è associabile ad una specifica malattia. Gli 
AAV sono di solito difettivi nel processo di replicazione del loro DNA che, per av- 
venire, richiede la presenza di un altro virus, normalmente un adenovirus: infatti 
alcuni dei geni precoci di adenovirus sono richiesti per promuovere la replicazione 
del DNA degli AAV. La presenza di un adenovirus ‘helper’ può non essere richiesta 
se cellule infettate con AAV subiscono trattamenti con raggi UV, cicloesimide (un 
inibitore della sintesi proteica) o alcune sostanze cancerogene (Bantel-Schaal, 
1991). Sembra, quindi, che la presenza del virus helper sia richiesta più per creare 
un ambiente cellulare modificato, che per la necessaria presenza di una specifica 
proteina virale. 

In assenza del virus helper, il genoma degli AAV si integra nella cellula ospite, 
dove persiste in forma latente di provirus. L'integrazione del DNA virale nel ge- 
noma ospite non è casuale, ma avviene in uno specifico locus sul cromosoma 19 
(Kotin et al., 1990). I vettori basati sull’utilizzo degli AAV hanno due sequenze in- 
vertite ripetute ITR (Inverted Terminal Repeats) di 145 basi all’interno del genoma 
virale. Gli ITR rappresentano gli unici elementi richiesti per la replicazione, la tra- 
scrizione, l’integrazione e l’excisione del provirus. Le sequenze ripetute formano 
delle strutture a forcina che sono essenziali per la replicazione del DNA virale. Il 
clonaggio all’interno del genoma di AAV viene facilitato dall’inserimento delle 
stesse ITR all’interno di un plasmide ed il clonaggio di DNA esogeno avviene tra 
queste sequenze. Frammenti di DNA lineare che contengono il gene esogeno fian- 
cheggiato dalle ITR possono essere ottenuti tagliando tali plasmidi ricombinanti 
con opportuni enzimi di restrizione. Questi frammenti di DNA possono poi essere 
transfettati nelle cellule ospiti, insieme con opportuni plasmidi helper che conten- 
gono i geni di AAV richiesti per l’integrazione del virus. Successivamente, si pos- 
sono ottenere preparazioni virali infettando le cellule con adenovirus helper che sti- 
molano il ciclo litico degli AAV ed il loro impacchettamento nei capsidi. Alla fine 
della procedura, i virus AAV completi possono essere purificati e separati dagli ade- 
novirus con metodi biochimici (Gao et al., 2000). È chiaro che tale metodologia si 
basa sull’utilizzo degli adenovirus per ottenere particelle virali AAV e ciò aumenta 
il rischio di contaminazioni. Quindi, i virus AAV ricombinanti, prodotti in tal modo, 
non possono essere utilizzati per sperimentazioni cliniche sull’uomo. Un metodo al- 
ternativo per la produzione di particelle virali AAV ricombinanti è mostrato in Fi- 
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Figura 12.5. Produzione di particelle AAV ricombinanti senza infezione adenovirale. Un frammento 
di DNA lineare (che contiene un gene esogeno sotto il controllo di un opportuno promotore) viene 
transfettato nella linea cellulare 293 di rene umano (che esprime il gene E1 di adenovirus) insieme 
con del DNA che contiene i geni Rep e Cap di AAV e con un altro frammento di DNA che porta i 
geni di adenovirus E2A, E4 ed i VA RNA. Le proteine Rep e Cap sono richieste per produrre i ge- 
nomi a singolo filamento di AAV e per incapsularli nei loro capsidi. Le proteine helper di adenovirus 
(E1, E2A, E4 e VA RNA), richieste per la replicazione litica di AAV, vengono prodotte all’interno delle 
cellule ospiti per promuovere la formazione delle particelle virali che contengono il gene esogeno. 
Queste ultime saranno poi usate per infettare le cellule bersaglio 


gura 12.5. In questo caso, il gene esogeno fiancheggiato dalle sequenze ITR è co- 
transfettato nella linea 293 di cellule di rene umano insieme a due altri frammenti 
di DNA: il primo contiene i geni necessari per la produzione di DNA genomico a 
singolo filamento di A AV, il secondo contiene i geni di adenovirus richiesti per la 
replicazione e l’impacchettamento delle particelle virali (Matsushita er al., 1998). 
Le particelle virali AAV ricombinanti, prodotte in questo modo, possono poi essere 
utilizzate per infettare cellule bersaglio, in cui fare esprimere il gene esogeno. 

Vettori derivati dagli AAV sono stati utilizzati per introdurre DNA esogeno in 
molti tipi di cellule, tra cui i neuroni (Davidson et a/., 2000), le cellule muscolari 
(Pruchnic et al., 2000) e le cellule epiteliali (Pajusola et al., 2002). Le proprietà 
che rendono i vettori AAV molto promettenti per possibili sviluppi nella terapia ge- 
nica (Sanlioglu et al., 2001) sono, principalmente, la localizzazione specifica del 
DNA esogeno all’interno del genoma della cellula ospite e la capacità di trasfor- 
mare una varietà di cellule în vivo, siano esse proliferanti o quiescenti. 
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12.3.4 Retrovirus 


I retrovirus sono gli unici virus animali che si integrano nel genoma della cellula 
ospite durante il loro normale ciclo di crescita. Ci sono due classi di retrovirus che 
infettano le cellule umane: i retrovirus HTLV (ad esempio HTLV-1, il virus della 
leucemia delle cellule T) (Yoshida e Seiki, 1987), ed i lentivirus (come l’HIV-1, il 
virus che causa l’immunodeficienza nell’uomo) (Luciw et al., 1984). Tuttavia, i re- 
trovirus sono stati trovati in un numero molto ampio di organismi, sia vertebrati che 
invertebrati. Le particelle virali (circa 100 nm di diametro) sono circondate da una 
membrana, costituita da un doppio strato lipidico, che viene per lo più acquisita 
quando il virus fuoriesce dalla cellula infettata. Nella membrana sono, però, presenti 
anche proteine virali e l’infezione si instaura come risultato dell’interazione tra que- 
ste proteine con specifici recettori cellulari presenti sulla superficie delle cellule ber- 
saglio (Sommerfelt, 1999). Il legame con il recettore causa l’internalizzazione della 
particella virale (Fig. 12.6). La membrana esterna viene parzialmente rimossa prima 
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Figura 12.6. Retrovirus. (a) La struttura della forma integrata di un tipico genoma retrovirale. Le lun- 
ghe sequenze terminali ripetute (LTRs) fiancheggiano i geni strutturali (gag, pol e env). Un sito d’im- 
pacchetttamento (y) è anche richiesto per l'inserimento dell'RNA virale nella spina “matura. (b) Il 
ciclo vitale di un retrovirus. Vedere il testo per ulteriori dettagli 
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che l’enzima trascrittasi inversa inizi a convertire il genoma ad RNA del virus in 
una copia di DNA a doppio filamento lineare. La sintesi della copia di DNA inizia a 
partire da una specifica molecola di tRNA (Mak e Kleiman, 1997), che deriva dalla 
cellula ospite in cui il virus è stato prodotto e che, come la stessa trascrittasi inversa, 
è stata impacchettata nella particella virale. Il DNA del provirus così sintetizzato 
viene poi integrato casualmente nel genoma, dove i geni virali vengono espressi 
producendo nuove proteine virali che daranno origine a nuove particelle virali. La 
produzione di nuovi virus non è direttamente responsabile della morte della cellula 
ospite, ma piuttosto essi fuoriescono dalla superficie della cellula per gemmazione. 
Le malattie associate alle infezioni retrovirali dipendono, di solito, dalle posizioni in 
cui il genoma del virus si è inserito all’interno del genoma della cellula ospite, o 
sono la conseguenza di alterazioni funzionali delle cellule infettate, come l’inva- 
sione del sistema immunitario da parte di HIV-1 che causa l’ AIDS. 

Il genoma di un retrovirus è composto da due molecole identiche di RNA a sin- 
golo filamento (di circa 8-11000 bp) che, come le molecole di mRNA, posseggono 
ciascuna un cappuccio in posizione 5’ ed una coda di poli-A in 3’ (Ratner et al., 
1985). Il genoma dell’RNA del virus non può essere usato prima che sia integrato 
nella cellula ospite. La trascrizione e la conseguente traduzione servono solo dopo 
che il genoma del DNA sia stato integrato nella cellula ospite. Tutti i retrovirus 
contengono tre geni strutturali principali, ciascuno dei quali codifica per un certo 
numero di proteine (Katz e Skalka, 1994): 


* gag: codifica un certo numero di proteine del capside; 


e pol: codifica la trascrittasi inversa che converte il genoma ad RNA nella sua co- 
pia a DNA, l’integrasi che integra il DNA virale nel genoma della cellula ospite 
e, talvolta, una proteasi (pro) richiesta per tagliare il prodotto del gene gag du- 
rante i processi di maturazione; 


* env: codifica per le proteine di superficie e di transmembrana dell’involucro. 


Alcuni retrovirus producono proteine addizionali: per esempio, pro può essere codi- 
ficata da un gene distinto. Tutte le proteine codificate da gag, pol e pro sono espresse 
da un singolo trascritto genomico di RNA. L’RNA che codifica per env è prodotto 
tramite splicing. Per comprimere un numero così elevato di geni in un piccolo ge- 
noma, il virus sfrutta una varietà di strategie, come lo splicing o lo slittamento del 
modulo di lettura da parte dei ribosomi (Farabaugh, 1996). Ad esempio, il gene pro 
spesso si sovrappone al gene gag e/o pol, ma viene tradotto utilizzando la stessa mo- 
lecola di mRNA. I geni strutturali del retrovirus sono fiancheggiati da sequenze 
LTR, che sono duplicate come parte del processo replicativo prima dell’integrazione 
nel genoma dell’ospite. La sintesi dell’RNA virale parte da un unico promotore al- 
l’interno dell’ LTR di sinistra e termina ad un segnale di poliadenilazione nell’ LTR di 
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destra. L’impacchettamento dell'RNA virale nelle particelle mature richiede un se- 
gnale apposito (y) localizzato tra l’LTR di sinistra ed i geni strutturali (Fig. 12.6(a)). 

Anche in questo caso, ci sono dei limiti nelle dimensioni di acido nucleico che 
può essere impacchettato nella particella virale, per cui la maggior parte dei vettori 
retrovirali sono difettivi nella replicazione. Gli LTR, il segnale d’impacchettamento 
(y) ed il sito di legame al primer, sono gli unici elementi genetici richiesti per il 
processo replicativo. Quindi, come già abbiamo discusso per i vettori adenovirali, 
particelle virali infettive devono essere prodotte in opportune linee cellulari che 
siano in grado di produrre le proteine virali richieste. Ad esempio, un gene esogeno 
può essere clonato in un plasmide che contiene le sequenze di DNA descritte sopra 
e che si trovi tra gli LTR di destra e di sinistra. Il vettore virale navetta ricombinante 
viene poi transfettato in una linea cellulare che esprime costitutivamente la trascrit- 
tasi inversa e le proteine del capside. I virus prodotti da questa linea cellulare pos- 
sono, poi, essere usati per infettare cellule bersaglio, dove il vettore si integrerà nel 
genoma ed il gene esogeno potrà essere espresso. In aggiunta al gene esogeno deve 
essere presente anche un marcatore per permettere di identificare le cellule che 
hanno effettivamente ricevuto il DNA ricombinante. 

Il vantaggio maggiore dei vettori retrovirali consiste nella stabilità della loro 
integrazione nella cellula ospite. L'integrazione di una singola copia del DNA vi- 
rale in un sito a caso del genoma dell’ospite, permette l’espressione del gene eso- 
geno integrato per molto tempo. Inoltre, i retrovirus sono un mezzo molto effi- 
ciente per introdurre DNA in cellule animali. I loro svantaggi principali consistono 
nella casualità del processo d’integrazione, che può avere effetti deleteri per la cel- 
lula ospite, e nel fatto che i retrovirus infettano solo cellule proliferanti. Questo è 
un serio limite al suo uso. Solo i lentivirus, come I'HIVI, potranno infettare e re- 
plicare cellule non in divisione. Quindi, si stanno compiendo molti sforzi per 
creare dei vettori lentivirali efficienti e sicuri (Zufferey et al., 1998). 


12.4 Marcatori selettivi ed amplificazione genica in cellule animali 


Come in tutti i processi di trasferimento del DNA descritti sino ad ora, anche l’in- 
corporazione di DNA in una cellula animale deve risultare in un cambiamento fe- 
notipico che ci permetta di distinguere le cellule che sono state transfettate da 
quelle che non hanno assunto DNA esogeno (Fig. 12.7). Nei primi esperimenti ese- 
guiti in questo campo è stata utilizzata la capacità di complementare il difetto nu- 
trizionale di una certa linea cellulare come saggio per riconoscere le cellule tran- 
sfettate. Ad esempio, cellule umane difettive nel gene che codifica per l’enzima 
ipoxantina guanina fosforibosiltransferasi (HPRT, che agisce in una delle vie per la 
biosintesi delle basi puriniche e la produzione di inosina monofosfato), incapaci di 
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Figura 12.7. Struttura del complesso proteico che lega la bleomicina (Maruyama et al., 2001). | siti 
di legame alla droga (in rosso) sono localizzati in profondi solchi ai lati della proteina dimerica (verde 
e blue) 


crescere in un terreno che contiene ipoxantina, aminopterina e timidina (HAT, che 
blocca la sintesi de novo di inosina monofosfato) (Lester et al., 1980), sono state 
transfettate con DNA genomico totale derivante da una linea cellulare selvatica. In 
tal modo, si possono isolare rare cellule che sono capaci di crescere in terreno 
HAT, in quanto hanno acquisito la capacità di sintetizzare 1 HPRT dalle cellule sel- 
vatiche (Szybalska e Szybalski, 1962). Analogamente, cellule di topo difettive per 
l’enzima timidina chinasi (TK, che fa parte della via di biosintesi dei nucleotidi) 
sono incapaci di crescere in terreno HAT, ma diventano in grado di crescere su 
questo terreno se transfettate con il gene 7 del virus dell’herpes simplex (HSV) 
(Wigler et al., 1977). Esistono molti altri marcatori metabolici che possono essere 
utilizzati per monitorare il processo di transfezione: tutti hanno, però, lo svantaggio 
di richiedere l’utilizzo di una linea cellulare mutata per monitorare l'avvenuta tran- 
sfezione. Questa limitazione è stata superata utilizzando dei marcatori selezionabili 
dominanti che conferiscono alle cellule transfettate la resistenza ad una particolare 
droga (Tabella 12.1). Antibiotici come l’ampicillina non hanno alcun effetto sulle 
cellule eucariotiche che sono prive di una parete cellulare. Antibiotici che inibi- 
scono la sintesi proteica possono essere attivi su cellule procariotiche ed eucarioti- 
che. Per esempio, il transposone TnS di E. coli codifica per un gene che conferisce 
la resistenza alla kanamicina (Yamamoto e Yokota, 1980). La kanamicina è un anti- 
biotico aminoglicosidico che interferisce con la traduzione ed induce la morte di 
cellule batteriche, agendo in modo sito-specifico sull’RNA ribosomale 165. A dosi 
molto alte, gli aminoglicosidi inibiscono la sintesi proteica anche nei mammiferi, 
probabilmente attraverso legami non specifici ai ribosomi e/o agli acidi nucleici 
(Mingeot-Leclereg, Glupezynski e Tulkens, 1999). Per riuscire ad ottenere una re- 
sistenza che possa essere usata come mezzo di selezione, è necessario che un altro 
gene codificato all’interno del transposone TnS (quello che produce la neomicina 
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‘ Tabella 12.1. Marcatori per la selezione di frammenti di DNA in cellule di eucarioti superiori 


Marcatore Prodotto genico Metodo di selezione Riferimento bibliografico 
neo  Aminoglicoside Selezione delle cellule con (Colbère-Garapin 
fosfotransferasi; gene G418 (0,1-1,0 ug/ml), un et al., 1981) 
neo dal transposone aminoglicoside simile 
batterico Tn5 alla kanamicina che 
blocca la sintesi proteica 
hyg Igromicina-B-transferasi; Selezione delle cellule in (Blochlinger e 
gene Ayg deriva Igromicina B (10-300 Diggelmann, 
da Escherichia coli 4g/ml), un aminociclitolo che 1984) 
inibisce la sintesi proteica 
pac  Puromicina-N-acetil Selezione delle cellule in (Vara et al., 1986) 
transferasi; il gene pac puromicina (0,5-5 ug/ml), 
deriva da Streptomyces un antibiotico che inibisce 
alboniger la sintesi proteica 
ble Proteina che lega la Selezione delle cellule in (Genilloud, Garrido 
bleomicina; il gene bleomicina o Zeocina e Moreno, 1984) 
ble è localizzato sul (50-500 ug /ml), un 
transposone batterico antibiotico che lega il DNA 
TnS o il gene Sa ble e blocca la sintesi di RNA 
di Staphylococcus aureus 
gpt Xantina-guanina Selezione delle cellule in (Mulligan e Berg, 
fosforibosil transferasi: terreno privo di guanina 1981) 
il gene gpt è isolato che contiene inibitori della 
da E. coli sintesi de novo di GMP 


e xantina; ciò seleziona per 
cellule g1p* che possono 
sintetizzare la guanina 
dalla xantina 


fosfotransferasi), sia posto sotto il controllo di un promotore eucariotico (ad es., il 
promotore rk dell’ HSV o un promotore precoce di SV40) (Berg, 1981). 

L'esposizione ad alti livelli di sostanze tossiche e per tempi lunghi può dare 
origine, seppur a bassa frequenza, alla formazione di cellule che sono diventate 
spontaneamente resistenti alla sostanza stessa. Per esempio, cellule di topo trattate 
con metotrexato (un analogo dell’acido folico che inibisce l’enzima diidrofolato re- 
duttasi DHFR) vanno incontro a tre tipi di mutazioni che generano resistenza 
(Schimke er al., 1978): 


e mutazioni all’interno della sequenza codificante per l’enzima DHFR: 


* mutazioni che prevengono l’entrata della droga nella cellula; 
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e amplificazione del locus DAfr che aumenta il numero di copie del gene Dhfr; 
porta ad una sovraproduzione dell'enzima nascondendo, così, l’effetto della 
droga. Il processo d’amplificazione sembra essere abbastanza casuale e, regioni 
del genoma anche estese che fiancheggiano il locus Dhfr, sono incluse nel DNA 
amplificato. 


Mutazioni che appartengono a quest’ultima classe sono particolarmente importanti 
per ottenere alti livelli d’espressione di geni esogeni. Il DNA esogeno viene clonato 
in un vettore plasmidico che porta anche il gene Dhfr: il plasmide viene poi tran- 
sfettato in cellule metotrexato-resistenti ed i ricombinanti vengono selezionati in 
presenza di alti livelli della droga. Le cellule che amplificano il locus Dhfr dovreb- 
bero contenere un elevato numero di copie del DNA esogeno (Wigler et al., 1980). 


12.5 Espressione di geni in cellule animali 


Geni esogeni possono essere espressi in cellule d’insetto infettate con baculovirus 
(Capitolo 8), ma le proteine ricombinanti possono essere prodotte anche in cellule 
di. mammifero. Tuttavia, l’inserimento di un gene esogeno in una cellula animale 
non è di solito sufficiente per permettere la sua efficiente espressione. Perché ciò 
possa avvenire è necessario che il gene che si vuole far esprimere sia messo sotto 
gli appropriati controlli trascrizionali e traduzionali del tipo di cellula in cui si 
vuole ottenere l’espressione stessa. La maggior parte dei promotori utilizzati per 
dirigere l’espressione di geni esogeni sono costitutivi. Abbiamo già discusso prece- 
dentemente il sistema d’espressione Tet per la produzione di proteine in cellule di 
mammifero (Capitolo 8). La maggior parte dei promotori costitutivi, utilizzati per 
guidare l’espressione in cellule transfettate, è trascrizionalmente attiva in un ampio 
spettro di cellule, anche se mostrano un certo grado di tessuto-specificità. Per 
esempio, il promotore del citomegalovirus (CMV), uno dei più utilizzati, è scarsa- 
mente attivo negli epatociti (Najjar e Lewis, 1999). Promotori costitutivi forti, in 
grado di guidare l’espressione di geni esogeni in molti tipi cellulari, sono: il pro- 
motore MLP di adenovirus, il promotore precoce del citomegalovirus umano, i 
promotori di SV40 e del virus del sarcoma di Rous e il promotore della 3-fosfogli- 
cerato chinasi di topo (Makrides, 1999). 

Oltre ad un buon promotore, l’espressione di un gene in cellule di mammifero 
richiede anche un sito di poliadenilazione, un segnale di terminazione della trascri- 
zione ed una varietà di elementi di controllo traduzionale. In genere, si è osservato 
che geni contenenti introni sono espressi a livelli più alti dei corrispondenti cDNA 
(Buchman e Berg, 1988). Ciò può essere dovuto all’accoppiamento tra trascrizione, 
splicing e maturazione degli mRNA nelle cellule di eucarioti superiori (Maniatis e 
Reed, 2002). 


1 3 Modificazioni genetiche 
degli animali 


Concetti chiave 


+ Per creare animali geneticamente modificati, geni nuovi o modificati 
possono essere integrati nel genoma 


+ Iniezione nel pronucleo: l'iniezione di frammenti di DNA nei nuclei di 
uova fecondate 


+ Una migliore comprensione degli eventi, che accadono durante gli 
stadi iniziali dell’embriogenesi, ha permesso lo sviluppo di tecnologie 
attraverso le quali interi animali possono essere prodotti dal DNA 
contenuto in una singola cellula 


+ Cellule staminali embrionali isolate dalla blastocisti possono essere 
mantenute in coltura, manipolate in vitro e re-impiantate nella blasto- 
cisti dove le cellule modificate possono dare origine all'animale 


+ Il trasferimento del nucleo da una cellula adulta completamente diffe- 
renziata all’interno di una cellula uovo, privata del suo nucleo, può 
risultare nella riprogrammazione del DNA della cellula adulta e gene- 
rare un animale clonato 


+ La correzione di malattie genetiche dell’uomo mediante la terapia 
genica ha enormi potenzialità: sono stati ottenuti risultati positivi in- 
coraggianti, ma sono necessari studi approfonditi per applicare tali 
tecnologie ad un numero consistente di malattie 


La possibilità di modificare specifiche caratteristiche d’interi organismi animali 
offre enormi possibilità per migliorare la nostra comprensione di fenomeni biolo- 
gici complessi, quali lo sviluppo e l’insorgenza di malattie. Per poter compren- 
dere come si possano creare interi animali geneticamente modificati è però ne- 
cessario acquisire alcune nozioni preliminari di embriologia (Burki, 1986) 
(Fig. 13.1). Subito dopo l’entrata dello spermatozoo nella cellula uovo, la cellula 
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Blastocisti 


Figura 13.1. Stadi iniziali dello sviluppo embrionale. Le immagini al microscopio sono state ottenute 
da www.fertilita.org 


fecondata, ora chiamata zigote, possiede due nuclei, detti anche pronuclei. Succes- 
sivamente, i pronuclei materno e paterno si fondono, formando un singolo nucleo 
fecondato. Lo zigote inizia poi a dividersi, prima in 2 cellule, poi in 4, in 8 e così 
via, formando una sfera di cellule che prende il nome di morula, dal latino “mora 
di gelso”. La morula continua a dividersi e si forma in essa una cavità che si riem- 
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pie di liquido proveniente dall’utero. A questo stadio, lo zigote prende il nome di 
blastocisti e la cavità interna si chiama blastocele. La cavità divide le cellule della 
blastocisti in una massa cellulare interna (che diventerà l'embrione) ed in un trofo- 
blasto esterno, che formerà la placenta. La blastocisti rimane libera nella cavità 
uterina per 2 giorni durante i quali forma la zona pellucida, che permette alla bla- 
stocisti d’impiantarsi nella parete dell’utero. L’embrione continua poi a crescere 
fino alla nascita. Non tutte le cellule che si formano durante l’embriogenesi an- 
dranno a far parte dell’animale: alcune sono programmate a morire come parte del 
normale processo di sviluppo (Sulston e Horvitz, 1977). 

Tre metodi principali sono stati sviluppati per introdurre DNA esogeno negli 
animali ed il topo è stato per lungo tempo l’organismo d’elezione per questo tipo 
di manipolazioni. Lo sviluppo di tecnologie per ottenere embrioni di topo modifi- 
cati (topi transgenici) è certamente il più avanzato, ma sono state sviluppate meto- 
dologie simili per l'applicazione ad altri animali d’interesse zootecnico. 


13.1 Iniezione nel pronucleo 


Il DNA può essere direttamente iniettato nei pronuclei di uova di topo appena 
fecondate (Palmiter e Brinster, 1986), in modo simile a quanto già discusso per 
l’iniezione di DNA in oociti di Xenopus (Capitolo 12). Infatti, subito dopo la fe- 
condazione, i pronuclei maschile e femminile sono visibili al microscopio come 
delle entità distinte. L’iniezione di DNA viene di solito fatta nel pronucleo ma- 
schile che è più grande, mentre l’uovo viene tenuto fermo da una pipetta di suzione 
utilizzando un micromanipolatore (Fig. 13.2). Il DNA iniettato può integrarsi nel 
DNA del pronucleo e, dopo la fusione con il pronucleo femminile, verrà incorpo- 
rato nello zigote. Gli embrioni iniettati vengono coltivati in vitro fino allo stadio di 
morula e poi impiantati in una femmina di topo pseudo-gravida che è stata prece- 
dentemente incrociata con un maschio vasectomizzato: lo stimolo dell’incrocio fa 
scattare gli appropriati cambiamenti ormonali richiesti affinché l’utero diventi un 
ambiente recettivo all’impianto dell'embrione ed al suo successivo sviluppo. Se il 
DNA esogeno è stato trasferito con successo, il topo che nascerà sarà eterozigote 
per tale DNA. Per verificare la presenza del DNA esogeno si preleva un piccolo 
pezzo della coda del topo neonato ed il DNA contenuto in tali tessuti viene analiz- 
zato mediante tecniche classiche, quali PCR, Southern blotting etc. L’incrocio tra 
due topi eterozigoti darà origine ad una progenie in cui un quarto dei topi sarà 
omozigote per il transgene. 

L’iniezione nel pronucleo è stata utilizzata per introdurre diversi tipi di DNA 
esogeno nei topi. Ad esempio, un frammento di DNA lineare, che contiene il pro- 
motore del gene della metallotioneina I di topo fuso al gene strutturale dell’ormone 
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Figura 13.2. La produzione di topi transgenici mediante iniezione nel pronucleo. Il DNA viene iniet- 
tato nel pronucleo maschile che è più grande e le cellule sono coltivate per diverse divisioni cellulari. 
Gli embrioni sono poi impiantati in una femmina di topo pseudo-gravida. Assumendo che il transgene 
si integri prima della | divisone cellulare, la prole sarà eterozigote per il transgene. L'incrocio tra indi- 
vidui eterozigoti genererà individui omozigoti 


della crescita di ratto, è stato microiniettato nei pronclei di uova di topo fecondate 
(Palmiter ef al., 1982). Dei 21 topi che sono nati dalle uova iniettate, sette porta- 
vano la fusione genica in esame e sei di questi erano significativamente più grandi 
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dei loro fratelli. Parecchi di questi topi transgenici avevano livelli di ormone nel 
siero molto più alti del normale e lo stesso si osservava per il corrispondente 
mRNA nel fegato. Dopo 74 giorni dalla nascita, i topi transgenici pesavano 44 gr, 
circa il doppio dei loro fratelli normali che pesavano 29 gr. La stessa tecnica è stata 
utilizzata anche per la produzione di proteine di possibile interesse terapeutico. Per 
esempio, l’antitripsina-0, umana (AAT) è stata prodotta in topi per il trattamento di 
malattie come la fibrosi cistica, in cui il tessuto connettivo è irreversibilmente dete- 
riorato. L’AAT è una proteina del plasma che inibisce l’elastasi, una componente 
importante nella risposta infiammatoria il cui eccesso può determinare l’alterazione 
di tessuti. Un frammento di DNA che contiene il gene dell’ AAT umana è stato mo- 
dificato in modo da sostituire il suo promotore naturale con quello che controlla la 
produzione della B-lattoglobulina nel latte di pecora ed il gene modificato è stato 
iniettato nel pronucleo di embrioni di topo (Archibald et al., 1990). Topi che espri- 
mevano il transgene nelle ghiandole mammarie producevano I’ AAT umana nel loro 
latte, alla concentrazione di circa 7 mg/ml. Allo stesso modo sono state prodotte 
delle pecore che producevano nel loro latte la proteina AAT dell’uomo, fino ad otte- 
nere una concentrazione di circa 60 mg/ml (Wright et al., 1991). 

Uno dei maggiori vantaggi dell’iniezione nei pronuclei consiste nel fatto che il 
DNA esogeno che si vuole inserire non deve necessariamente essere stato in prece- 
denza clonato in un vettore. Frammenti di DNA possono essere direttamente iniet- 
tati e spesso si integrano nel genoma di topo in copie multiple in tandem (fino a di- 
verse centinaia) in una posizione del genoma più o meno casuale. I potenziali svan- 
taggi di tale tecnologia sono però numerosi: 


e La natura stessa dell’evento d’integrazione indica che l’iniezione nel pronucleo 
può essere utilizzata solo per aggiungere geni all’animale. Non può, cioè, essere 
utilizzata per eliminare dei geni (knock-out) o per modificare geni già esistenti 
nel genoma. 


e La casualità dell’evento d’integrazione può avere conseguenze notevoli sull’espres- 
sione del gene stesso e dipende dal sito d’integrazione nei diversi animali. 
L'espressione del transgene è quindi difficile da controllare. 


* Il livello di espressione del transgene non è del tutto ereditario. Infatti, la pro- 
genie di animali transgenici, che esprimono originariamente alti livelli del 
gene in esame, mostra, successivamente, livelli variabili d'espressione. In al- 
cuni casi ciò è dovuto a fenomeni di metilazione del transgene (Palmiter, Chen e 
Brinster, 1982). 


e La produzione di topi transgenici tramite inizione nel pronucleo può anche dare 
origine ad animali “a mosaico”, in cui l’espressione del transgene è limitata solo 
ad alcuni tessuti o organi. Ciò accade quando l’integrazione del transgene av- 
viene dopo la prima divisione cellulare. Possono avvenire anche eventi multipli 
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d’inserzione in loci genomici diversi ed in tempi diversi, così che un singolo topo 
può essere “un mosaico” per un tipo d’inserzione, ma non per un’altra. 


13.2 Cellule staminali embrionali 


Le cellule staminali embrionali (ES) sono cellule indifferenziate isolate dalla 
massa cellulare della blastocisti (Evans e Kaufman, 1981) (Fig. 13.1). Tali cellule 
possono essere coltivate in vitro all’interno di una piastra ricoperta con cellule em- 
brionali della pelle di topo, trattate in modo tale che non possano dividersi. Questo 
strato di cellule fornisce una superficie idonea per l’adesione delle cellule ES e, 
allo stesso tempo, permette il rilascio di nutrienti nel mezzo di coltura. Diversa- 
mente da quanto accade per molte altre cellule animali, le cellule ES possono es- 
sere mantenute in coltura per molte generazioni. Cellule ES in coltura rimangono 
indifferenziate, ammesso che crescano ben separate tra di loro: se si aggregano, 
formando una massa di cellule, iniziano a differenziarsi spontaneamente. Le cellule 
ES hanno la potenzialità di dare origine a tutti i tipi cellulari presenti nell’animale 
adulto (cellule muscolari, nervose. epidermiche etc.), inclusi i gameti (Nagy et al., 
1993). Sono, inoltre, stati sviluppati dei protocolli sperimentali per ottenere lo spe- 
cifico differenziamento di cellule ES in coltura (Keller, 1995). Ad esempio, cellule 
ES coltivate in presenza di cellule dello stroma e di varie citochine sono in grado 
di dare origine ad eritrociti primari ed altri precursori delle cellule ematopoietiche 
(Nakano, Kodoma e Honjo, 1994; Kennedy er al., 1997). 

La possibilità di mantenere le cellule ES in coltura per tempi molto lunghi, 
unita alla loro capacità di potersi differenziare în vitro in una varietà di tipi cellu- 
lari diversi, rende le cellule ES particolarmente attraenti per l’applicazione di sva- 
riate tecniche di manipolazione genetica. Il metodo di base per l’utilizzo di cellule 
ES nella produzione di animali è mostrato in Fig. 13.3. Il DNA esogeno può essere 
introdotto in cellule ES in coltura utilizzando alcune delle metodologie discusse 
precedentemente (Capitolo 12) e si può procedere alla selezione delle cellule tran- 
sfettate. Le cellule ES ricombinanti sono poi introdotte in una nuova blastocisti, 
dove si mescolano con le altre cellule presenti nella massa interna. La blastocisti è, 
infine, impiantata nell’utero di una femmina pseudo-gravida e può dare origine ad 
una progenie. La blastocisti che è stata impiantata contiene sia cellule ES normali 
che ricombinanti e, quindi, la risultante progenie sarà chimerica, dato che solo al- 
cune cellule conterranno il transgene. Gli animali chimerici così ottenuti verranno 
poi incrociati con animali normali per dare origine a veri eterozigoti che, incrociati 
tra di loro, genereranno organismi omozigoti. Quindi, la creazione di un individuo 
omozigote, partendo da cellule ES, richiede due incroci. 

Uno dei vantaggi delle cellule ES è la loro efficienza nei meccanismi di ricom- 
binazione omologa. Questo significa che si possono ottenere dei transgeni mirati, 
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Figura 13.3. Cellule staminali embrionali (ES). Cellule ES vengono prelevate dalla massa cellulare 
della blastocisti e coltivate /n vitro. Le cellule ES possono essere geneticamente modificate prima di 
reintrodurle in un’altra blastocisti 


in cui specifici geni possono venire deleti o modificati (Thomas e Capecchi, 1987). 
La ricombinazione tra sequenze di DNA omologhe presenti nel vettore e nel ge- 
noma viene utilizzata come mezzo per introdurre il frammento di DNA esogeno in 
una specifica localizzazione del genoma stesso. Nonostante le cellule ES siano ca- 
paci di ricombinazione omologa, possono avvenire anche eventi di ricombinazione 
non-omologa e, quindi, è necessario poter distinguere i due tipi di eventi. Un me- 
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Figura 13.4. Selezione di un knock-out genico in cellule ES in coltura. (a) La ricombinazione non- 
omologa determina il trasferimento nella cellula ospite sia della resistenza alla neomicina che del gene 
codificante per la timidina chinasi (tk). (b) La ricombinazione omologa determina il trasferimento solo 
del gene che procura la resistenza alla neomicina. (c) Struttura del ganciclovir. Le cellule che conten- 
gono il gene tt vengono uccise se trattate con ganciclovir, che è fosforilato dalla timidina chinasi e va 
incontro ad ulteriori fosforilazioni da parte di altre chinasi presenti nella cellula. Nella sua forma fosfori- 
lata, il ganciclovir inibisce la DNA polimerasi, agendo come terminatore della sintesi del DNA 


todo per ottenere la delezione di un gene attraverso meccanismi di ricombinazione 
omologa è mostrato in Figura 13.4. Viene costruito un vettore in cui le sequenze di 
DNA, che corrispondono alle regioni che fiancheggiano in 5’ ed in 3° il gene che 
deve essere eliminato dal genoma, sono clonate a destra ed a sinistra di un marca- 
tore di selezione (ad es., il gene che determina la resistenza alla neomicina, la cui 
presenza permette alle cellule di crescere in presenza di G418). Il vettore contiene, 
inoltre, il gene che codifica per la timidina-chinasi (14) di HSV. Un frammento di 
DNA lineare che porta queste sequenze viene transfettato all’interno di cellule ES 
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in coltura e si opera la selezione delle cellule ES transfettate, aggiungendo G418 al 
mezzo di coltura. Per distinguere le cellule che hanno integrato il frammento di 
DNA attraverso meccanismi di ricombinazione omologa o non-omologa, si opera 
un'ulteriore selezione con ganciclovir. Questa sostanza è un analogo sintetico 
della 2’-deossiguanosina (Fig. 13.4c) e viene fosforilato dalla timidina-chinasi, 
dando origine ad un analogo del dGTP, che inibisce l’attività della DNA polime- 
rasi. Se il frammento di DNA è stato inserito a caso, il gene f rimane associato al 
transgene e la cellula muore come conseguenza del trattamento con ganciclovir. 
Se, invece, l’integrazione avviene attraverso meccanismi di ricombinazione omo- 
loga, il gene rk viene perso e le cellule sopravviveranno al trattamento con la so- 
stanza tossica (Mansour, Thomas e Capecchi, 1988). Tale procedura, oltre alla pos- 
sibilità di eliminare un gene (knock-out), può permettere di sostituire un gene con 
una sua copia mutata. La versione alterata del gene viene semplicemente clonata 
nel vettore vicina al gene che determina la resistenza alla neomicina e poi transfet- 
tata nelle cellule ES. Le regioni di omologia alle estremità del frammento di DNA 
lineare determinano la localizzazione genomica (o lo specifico gene) nel quale il 
transgene verrà inserito. 


La capacità di generare knock-out di specifici geni rappresenta un metodo 
molto potente per comprendere la loro funzione nell’animale e l’organismo mo- 
dello più utilizzato per l’applicazione di tale strategia è il topo (Osada e Maeda, 
1998). I knock-outs possono essere degli ottimi modelli per lo studio di malattie 
dell’uomo e nel Capitolo 10 abbiamo già discusso alcune delle difficoltà associate 
a questo tipo di analisi. I topi knock-out possono dare origine a tre classi di feno- 
tipi: 

* Fenotipo letale. La delezione del chaperone molecolare hsp47 è letale in em- 
brioni di topo, probabilmente come conseguenza di una sintesi alterata del colla- 
gene (Nagai et al., 2000). 


* Fenotipo particolare (mutante). La delezione del gene soppressore del tumore 
pS3 non pregiudica lo sviluppo embrionale dei topi, ma questi diventano estre- 
mamente suscettibili all’inosorgenza di tumori (Donehower et al., 1992). 


* Nessun fenotipo particolare. La delezione di Matrilin 1, un gene codificante per 
una proteina della matrice extracellulare espressa nella cartilagine, non causa al- 
cun fenotipo visibile nei topi (Aszodi et al., 1999). 


Un fenotipo letale riflette, di solito, una funzione esclusiva del gene e preclude 
un’analisi della sua funzione in stadi più tardivi dello sviluppo. Poiché gli eucarioti 
multicellulari sono diploidi, i mutanti che rientrano in questa classe possono essere 
analizzati allo stato eterozigote (+/-). Alternativamente, si possono produrre knock- 
out condizionali che descriveremo più avanti. Le delezioni geniche che non cau- 
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sano alcun fenotipo possono riguardare geni che agiscono in vie metaboliche paral- 
lele, che sono in grado di compensarsi una con l’altra. È anche possibile che il di- 
fetto sia minimo e non rilevabile con le tecniche tradizionalmente usate. La com- 
plessità dei genomi degli animali è, inoltre, così elevata che una delezione può 
avere un effetto in una certa linea di topo, ma non in un’altra. Questo, per esempio, 
è quello che è stato osservato per la delezione del gene che codifica per il fattore di 
crescita dell’epidermide: la delezione è letale in embrioni della linea CF-1 di topo, 
mentre la delezione dello stesso gene nella linea CD-1 determina la morte dei topi 
solo 3 settimane dopo la nascita (Threadgill et a/., 1995). Quindi, idealmente, espe- 
rimenti di knock-out dovrebbero essere eseguiti su più linee di topi, ma i tempi ed i 
costi per tale lavoro sono enormi. 

Un problema connesso a questa modalità di produrre animali transgenici è rap- 
presentato dal trasferimento nell’animale transgenico del marcatore utilizzato per 
la selezione, un problema già riscontrato nella produzione di piante transgeniche 
(Capitolo 11). L'espressione ad alti livelli di geni che conferiscono resistenza ad un 
antibiotico non è una buona cosa: l’espressione del marcatore può indurre l’espres- 
sione anomala anche di geni adiacenti e si dovrebbe anche evitare la possibilità di 
trasferire il marcatore ad animali non transgenici. In effetti, il marcatore può essere 
eliminato dopo che il transgene si è integrato nel genoma delle cellule ES, se le se- 
quenze del gene marcatore sono fiancheggiate da siti /oxP, le sequenze che, come 
detto precedentemente, sono riconosciute dalla ricombinasi Cre (Kilby, Snaith e 
Murray, 1993). La transfezione della linea cellulare transgenica con un plasmide, 
che esprime la ricombinasi Cre, catalizza l’excisione del DNA compreso tra i due 
siti /oxP, rimuovendo così il marcatore e lasciando al suo posto un singolo sito 
loxP. 

Ci sono molti casi in cui l’espressione di un transgene è richiesta in uno speci- 
fico tessuto o solo in particolari cellule. Questo si può ottenere se l’espressione del 
gene esogeno è posta sotto il controllo di un promotore tessuto-specifico. Ad esem- 
pio, il promotore del gene che codifica per la chinasi II dipendente dalla presenza 
di calcio e di calmodulina (CaMKIIc) determina l’espressione del gene solo nei 
neuroni dell’ippocampo (Mayford er al., 1996). Naturalmente, questo approccio 
funziona bene solo se si hanno a disposizione dei promotori fortemente tessuto- 
specifici (Tabella 13.1). 

Knock-out di tipo condizionale possono anche essere prodotti utilizzando il si- 
stema ricombinativo /oxP-Cre, sopra citato (Gossen e Bujard, 2002). Se, per esem- 
pio, la delezione di un certo gene causa un fenotipo di letalità embrionale, può es- 
sere necessario eliminare il gene solo dopo la nascita e, un sistema per ottenere, ciò 
è mostrato in Figura 13.5 (Kiihn et al., 1995). La copia normale del gene che si 
vuole eliminare viene sostituita nel genoma da una versione del gene che è fian- 
cheggiata da siti /oxP (spesso chiamato gene floxed). L'animale transgenico viene 
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Figura 13.5. Knock-out genico tessuto-specifico. Vedere il testo per dettagli 


Tabella 13.1. Alcuni promotori tessuto-specifici del topo. Adattato da Lewandoski (2001) 


Promotore 


Alb 
CaMKa 


Cryoa 
En2 
Gcg 
Ins2 
KRTS 


Lek 


Msx2 


Gene normalmente 
controllato 


Albumina 
Chinasi Ila Ca?+/ 
calmodulina- 

dipendente 
Cristallino XA 
Engrailed 


Glucagone 
Insulina II 


Cheratina 5 

Tirosina-chinasi 
specifica per 
i linfociti 

Msh-like gene 2 
Homeobox 


Miogenina 
Nestina 


Gene 6 paired-box 

Riferimento senza ali 
sito 1 d’integrazione 
MMTV 


Tessuto o cellule 
in cui viene espresso 


Fegato 
Cervello anteriore 


Cristallino 
Mesencefalo e 

romboencefalo 
Cellule a 

del pancreas 
Cellule B 

del pancreas 
Epidermide 
Cellule T 


Ectoderma apicale 
della bozza 
dell’ arto 
Muscolo scheletrico 
Cellule neuronali 


Retina 
Cresta neurale 
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contemporaneamente modificato così da portare una copia del gene codificante per 
la ricombinasi Cre sotto il controllo di un promotore inducibile, come il promotore 
MxI. MxI fa parte del sistema di difesa virale del topo ed è trascrizionalmente 
inerte in un topo sano (Hug et al., 1988). Il promotore viene però attivato da alti li- 
velli d’interferone o dall’aggiunta di lunghi RNA sintetici a doppio filamento che 
inducono nelle cellule la produzione d’interferone. In questo modo, gli animali 
transgenici mantengono una copia funzionale del gene che deve essere deleto, fino 
a che non vengono iniettati con RNA a doppio filamento. 

Invece di costruire un topo transgenico che contiene sia il promotore tessuto- 
specifico (che esprime la Cre ricombinasi), che il gene bersaglio fiancheggiato 
dai siti /oxP, sono stati prodotti topi transgenici ognuno contenente uno specifico 
promotore tessuto-specifico che controlla l’espressione di Cre. Questi topi sono 
poi usati come una specie di ‘banca’ con cui incrociare un topo transgenico che 
porta un particolare gene ‘floxed’. L’incrocio tra questi ceppi di topo porterà alla 
formazione di progenie in cui il gene è inattivato solo nei tessuti in cui viene 
espressa la Cre ricombinasi (Gu et al., 1994). Quindi, un singolo gene ‘floxed’ 
può essere deleto in tessuti diversi senza la necessità di utilizzare ulteriori mani- 
polazioni. 

Il sistema che controlla l’espressione inducibile della tetraciclina (Capitolo 8), 
può essere utilizzato per guidare l’espressione di Cre e regolare la funzione di 
knock-outs. In questo modo, una proteina di fusione composta dal repressore della 
tetraciclina (tetR) e dal dominio di attivazione acida della proteina del virus 16 di 
herpes simplex (VP16), è in grado di regolare l’espressione del gene Cre da parte 
di un promotore che contiene le sequenze corrispondenti all’operatore tet (tetO). In 
assenza di tetraciclina, il gene Cre viene espresso ed induce la ricombinazione sito- 
specifica tra i due siti /oxP, ma, in presenza di tetraciclina, Cre non verrà espressa 
e non si avrà ricombinazione (St-Onge, Furth e Gruss, 1996). 


13.3 Trasferimento nucleare 


Anche se le cellule animali diventano sempre più programmate via via che pro- 
cedono lo sviluppo ed il differenziamento, il DNA contenuto in ogni cellula 
mantiene tutta l’informazione genetica richiesta per dare origine ad un intero or- 
ganismo. Ne deriva che se il nucleo di una cellula differenziata viene introdotto 
in una cellula uovo privata del suo nucleo, in appropriate condizioni, il nuovo nu- 
cleo può venire, per così dire, ‘riprogrammato’ in modo tale da rigenerare un or- 
ganismo intero. La produzione di animali clonati (tutti originati da una singola li- 
nea cellulare, eventualmente ricombinante) può avere numerose potenziali appli- 
cazioni. 
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* Produzione di proteine ricombinanti. Abbiamo discusso precedentemente che 
la produzione di proteine ricombinanti non è necessariamente ereditaria (Capi- 
tolo 12). Ne consegue che la possibilità di ottenere animali diversi in grado di 
produrre, ad esempio, quantità notevoli di una proteina di potenziale interesse te- 
rapeutico, richiede la creazione di animali clonati. 


* Conservazione di specie animali in via d’estinzione. Animali clonati possono es- 
sere utilizzati per il ripopolamento di specie naturali in via d’estinzione. 


L’idea di trasferire un nucleo da una cellula ad un’altra non è nuova. Oltre 50 
anni fa era stato scoperto che i nuclei delle cellule della blastocisti della rana 
erano in grado, se impiantati in cellule uovo private di nucleo, di dare origine ad 
una progenie di rane clonate identiche a quelle delle cellule donatrici (Briggs e 
King, 1952). Era stato, però, anche osservato che, se le cellule donatrici erano 
più differenziate, diventava sempre più difficile che potessero venire riprogram- 
mate per produrre nuovi animali. I pochi embrioni clonati da cellule differen- 
ziate si sviluppavano in modo anormale, facendo ritenere che il potenziale gene- 
tico diminuisse durante il differenziamento, rendendo impossibile il clonaggio di 
un organismo partendo da una cellula adulta differenziata. Nel 1975, però, John 
Gurdon è riuscito a sviluppare un metodo di trasferimento nucleare usando cel- 
lule completamente differenziate e uova di Xenopus (Gurdon, Laskey e Reeves, 
1975). 


Questo procedimento prevede due passaggi: 


* Produzione di uova enucleate. L'eliminazione del nucleo dagli oociti di rana 
viene eseguita con un micromanipolatore al microscopio. Gli oociti privi di nu- 
cleo non possono dividersi né differenziarsi, anche se vengono fecondati. 


e Introduzione di un nuovo nucleo. Nuclei provenienti da cellule della pelle di 
rane adulte vengono trasferiti negli oociti enucleati. Molti di questi oociti si 
comportano come uova normalmente fecondate e sono in grado di dare origine a 
dei girini. Questi derivano da cellule dello stesso organismo adulto e, quindi, 
contengono tutti lo stesso materiale genetico e rappresentano cloni uguali tra 
loro prodotti da cellule del tutto differenziate. Ciò suggerisce che il potenziale 
genetico del DNA non è, almeno apparentemente, alterato in cellule altamente 
specializzate. 


Una procedura parzialmente modificata è stata recentemente utilizzata per clonare 
gli animali (Fig. 13.6). In questo caso, sono state prelevate delle cellule dalla bla- 
stocisti di un embrione di pecora che sono poi state fuse con uova enucleate (Smith 
e Wilmut, 1989). Le cellule così ricostituite sono state sottoposte ad uno stimolo 
elettrico, prima dell’impianto in una pecora adulta. Pecore clonate sono successiva- 
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Pecora 1 Pecora 2 


della mammella 
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le cellule 


Coltivare le cellule 
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Figura 13.6. Trasferimento nucleare. Le cellule di una pecora adulta (pecora 1) sono fuse con cellule 
enucleate di una pecora di varietà diversa (pecora 2). Il risultato della fusione viene fatto crescere in 
coltura fino allo stadio di blastocisti prima dell'impianto in una pecora che porti a termine la gravi- 
danza. L'agnello che nascerà avrà il genoma nucleare della pecora 1 


mente state prodotte partendo da nuclei di cellule embrionali in coltura (Campbell 
et al., 1996) e da colture di cellule epiteliali prelevate dalla mammella (Wilmut ef 
al., 1997). Quest'ultimo approccio è stato quello utilizzato per produrre Dolly, la 
pecora più famosa del mondo! (Box 13.1). Il successo di questi esperimenti sembra 
dipendere dalla sincronizzazione dei cicli di divisione delle cellule che vengono 
fuse. Nel caso di Dolly, si è proceduto a rendere quiescente la cellula donatrice 
prima della fusione cellulare. La percentuale di successo della fusione si abbassa 
notevolmente usando cellule non sincronizzate. 


Box 13.1 Vita e morte di Dolly 


Dolly è stato il primo clone di mammifero prodotto da una cellula adulta 
(Wilmut et al., 1997). i 


* Cellule donatrici. Il tessuto della ghiandola mammaria di una pecora Finn 
Dorset di 6 anni è stato utilizzato per preparare la coltura cellulare prima- 
ria. Questa coltura conteneva circa il 90% di cellule epiteliali della mam- 
mella, oltre a cellule mio-epiteliali e fibroblasti. Un passaggio importante 
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nel processo di clonaggio è stato quello di indurre nelle cellule donatrici 
l’uscita dal ciclo cellulare e l’entrata in quiescenza (G;), prima del trasferi- 
mento del nucleo. Ciò è stato possibile semplicemente non nutrendo le cel- 
lule in coltura attraverso una riduzione della concentrazione di siero nel ter- 
reno di crescita. 


* Cellule riceventi. Gli oociti sono stati prelevati da pecore adulte Scottish 
Blackface, 28-33 ore dopo l’iniezione di un ormone che determina il rilascio 
di gonadotropina (GnRH); gli oociti sono stati enucleati con una pipetta di 
vetro al micromanipolatore. 


* Fusione cellulare. La fusione tra gli oociti enucleati e le cellule donatrici ed 
il successivo stimolo dell’oocita allo sviluppo, sono sati indotti attraverso una 
serie d’impulsi elettrici. Sono state prodotte 277 fusioni cellulari. 


* Crescita ed impianto. Le cellule fuse sono state coltivate in ovidotti di pe- 
cora. Dopo 6 giorni di coltura, 29 su 277 cellule fuse erano riuscite a svilup- 
parsi in una morula o in una blastocisti. Uno, due o tre embrioni sono poi 
stati trasferiti in pecore Scottish Blackface per cercare di portare a termine la 
gravidanza. Solo una delle 13 pecore in cui erano state trasferite le 29 mo- 
rule/blastocisti è rimasta gravida. Il 5 luglio del 1996, dopo un normale pe- 
riodo di gravidanza di 148 giorni, è nata Dolly, una pecora Finn Dorset sana, 
di 6,6 kg, nome in onore della cantante Dolly Parton. 


Box Figura 13.1. Dolly ed il suo agnello Bonnie. Immagine gentilmente concessa dal Rosilin Institute 
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Il preciso tipo cellulare da cui deriva Dolly rimane incerto. Indagini successive 
hanno dimostrato che Dolly derivava davvero da cellule della ghiandola mam- 
maria della pecora donatrice o non da una qualche cellula contaminata 
(Ashworth er a/., 1998). Il DNA mitocondriale di Dolly originava, invece, dagli 
oociti enucleati utilizzati per la fusione (Evans et a/., 1999). Dolly era, quindi, 
una chimera con DNA nucleare che derivava da cellule somatiche e DNA mito- 
condriale che proveniva dagli oociti. È anche sorprendente notare che nell’arti- 
colo originale (Wilmut et al., 1997), in cui veniva descritta la creazione di 
Dolly, i termini “clone” o “clonaggio” non sono mai stati utilizzati. Probabil- 
mente gli autori si erano resi conto delle possibili polemiche che sarebbero 
sorte sul loro risultato ed hanno volutamente utilizzato un linguaggio prudente. 
Dolly è diventata una pecora adulta ed ha generato una prole (Box, Fig. 13). Le 
pecore Finn Dorset hanno una vita media di circa 12 anni, ma nel gennaio del 
2002 Dolly ha incominciato a soffrire di artrite ed all’età di soli 6 anni, il 14 
febbraio 2003, Dolly è stata soppressa in seguito alla diagnosi di una malattia 
polmonare di tipo progressivo. 


La metodologia del trasferimento nucleare per produrre animali da cellule 
adulte differenziate pone una serie di problemi (Wilmut er al., 2002). È probabile 
che non tutte le difficoltà riportate qui sotto siano dovute al processo stesso di tra- 
sferimento nucleare, dato che anormalità simili sono state riscontrate anche per 
colture embrionali. 


* Il processo è molto inefficiente. Nel caso di Dolly soltanto 1 su 277 fusioni cellu- 
lari è stata in grado di dare origine ad una prole. Bassi livelli d’efficienza sono 
stati riportati in esperimenti di clonaggio anche con altri animali. 


e Molti degli embrioni prodotti con il trasferimento nucleare presentano delle anor- 
malità. Oltre alla bassa efficienza con cui si formano gli embrioni, il trasferi- 
mento nucleare è associato ad alti livelli di morte fetale e neonatale ed alla pre- 
senza di anomalie nella prole. 


* Dolly è nata dopo un periodo di gestazione normale e con un peso normale, ma 
parte della prole che deriva da procedimenti di trasferimento nucleare nasce 
con un peso più elevato (sindrome LOS) e dopo periodi di gestazione più lun- 
ghi del normale (Lazzari et al., 2002). La frequenza con cui si verificano tali 
anomalie è molto variabile, anche utilizzando le stesse condizioni sperimentali, 
ed è probabilmente connessa a differenze nel controllo dell’espressione genica 
nell’embrione. 
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* Dato che Dolly derivava da una cellula che potenzialmente aveva 6 anni, ci si è 
domandati che età potesse avere Dolly alla nascita, analizzando la lunghezza 
delle regioni telomeriche dei suoi cromosomi. I telomeri, infatti, si accorciano 
progressivamente con l’età, nonostante gli effetti di tale fenomeno siano ancora 
in gran parte sconosciuti. Dolly aveva dei telomeri più corti, in paragone a pecore 
della stessa età (Shiels er a/., 1999) e Dolly ha sofferto di artrite che è una malat- 
tia rara in una pecora di quella età (Williams, 2002). Non è però chiaro se quella 
malattia ed altri problemi che hanno portato alla morte di Dolly siano collegati al 
procedimento di trasferimento nucleare che è stato utilizzato per la sua produ- 
zione. 


* Alterazioni diffuse del quadro di metilazione del DNA sono state descritte negli 
embrioni di molti animali clonati, ma gli effetti di tali variazioni sono poco chiari 
(Fairburn, Young e Hendrich, 2002). 


e La tecnica del trasferimento nucleare è ancora in una fase iniziale di sviluppo, in 
particolare per quanto riguarda gli effetti dell’invecchiamento e dell’ereditarietà. 
In due studi indipendenti, animali clonati da un certo tipo cellulare sono diventati 
obesi nell’età adulta (Tamashiro et al., 2002), mentre quelli clonati da un altro 
tipo cellulare sono morti prematuramente (Ogonuki et al., 2002). È chiaro che in 
tale settore sono necessari ulteriori studi. 


La tecnica del trasferimento nucleare utilizzata per Dolly è stata riprodotta o par- 
zialmente modificata per produrre, da cellule adulte, cloni di molti animali da alle- 
vamento (mucche, oche e maiali) (Cibelli er al., 1998; Baguisi et al., 1999; Po- 
lejaeva et al., 2000), organismi geneticamente più facili da manipolare come i topi 
(Wakayama et al., 1998), o animali domestici come gatti e conigli (Shin et al., 
2002; Chesnè et al., 2002). Nel 2003 i giornali hanno riportato la nascita del primo 
essere umano clonato. La notizia non ha avuto conferme scientifiche, ma è proba- 
bile che ciò possa essere realizzabile in un prossimo futuro. È auspicabile che le 
difficoltà che si sono riscontrate nel clonaggio di animali costituiscano un deter- 
rente a riprodurre tali procedure nell’uomo. 

A parte l’impatto molto negativo suscitato dalla tecnica del trasferimento nu- 
cleare, la procedura si è rivelata utile per produrre animali con caratteristiche spe- 
cifiche. La possibilità di ricreare un intero animale da cellule che sono state mani- 
polate in vitro, potrebbe avere conseguenze positive in molte applicazioni mediche. 
Ad esempio, ci sono notevoli potenzialità applicative per utilizzare organi (fegato, 
cuore etc.) d’origine animale nella sostituzione di organi umani mal funzionanti. 
Questa strategia, chiamata xenotrapianto, crea spesso dei problemi a causa di dif- 
ferenze strutturali, tra cellule umane e di animali, e nei carboidrati presenti sulla 
superficie cellulare. Tutti gli animali posseggono l’enzima @(1,3)-galattosil-tran- 


396 MODIFICAZIONI GENETICHE DEGLI ANIMALI 13 


sferasi che catalizza la formazione del disaccaride galattosio-0(1,3)-galattosio sulla 
superficie delle cellule e la presenza di questo disaccaride è alla base del rigetto 
degli organi animali trapiantati nell’uomo. Il problema può essere parzialmente ri- 
solto rimuovendo, almeno temporaneamente, gli anticorpi contro tale disaccaride 
nel soggetto da sottoporre a trapianto. Tuttavia, la riformazione degli anticorpi in 
tempi successivi può causare fenomeni di rigetto, anche se il paziente viene sotto- 
posto a trattamenti immunosoppressivi. Sono state prodotte delle pecore in cui il 
gene (GGTAI1), che codifica per l’2(1,3) galattosil-transferasi, è stato sostituito, in 
cellule in coltura, con il gene che codifica per la resistenza alla neomicina; la tec- 
nica del trasferimento nucleare è stata poi utilizzata per generare embrioni di pe- 
cora (Denning et al., 2001). Sfortunatamente, i feti sono morti prima della nascita 
e non si è potuto quindi verificare se organi di animali così modificati fossero più 
idonei per il trapianto nell'uomo. Recentemente, sono stati prodotti maiali in cui 
uno o entrambi gli alleli del gene GG7AI/ erano stati deleti (Lai et al., 2002; Dai er 
al., 2002; Phelps et al., 2002). Alcuni dei maiali knock-out sono apparentemente 
sani e studi futuri permetteranno di valutare se i loro organi siano più adatti per tra- 
pianti nell’uomo. 


13.4 Terapia genica 


La terapia genica consiste in un approccio sperimentale innovativo per trattare, cu- 
rare e prevenire una serie di malattie, modificando l’espressione di specifici geni in 
un individuo. L'idea è apparentemente semplice, basandosi sulla possibilità di so- 
stituire il gene alterato in un individuo malato con la copia selvatica del gene, così 
da produrre la proteina normale ed alleviare i sintomi della malattia (Morgan e 
Anderson, 1993). Nonostante si parli di terapia genica da diverso tempo, le sue 
applicazioni concrete sono ancora molto limitate e la sperimentazione clinica sul- 
l’uomo è ancora allo stadio di ricerca. La terapia genica è potenzialmente applica- 
bile soprattutto a malattie monofattoriali, in particolare a sindromi genetiche re- 
cessive, in cui una copia normale del gene dovrebbe essere capace di mascherare 
l’attività alterata del gene difettivo (Tabella 13.2). L'inserimento del transgene in 
grado di funzionare potrebbe essere ottenuto sia in cellule germinali che in cellule 
somatiche. 


* Terapia genica sulle cellule germinali. Le cellule uovo o gli spermatozoi possono 
essere modificati con l’idea che il cambiamento sia poi trasmesso alla progenie. 
La terapia genica sulle cellule germinali è, però, proibita nella maggior parte dei 
paesi, sia per ragioni etiche che per la mancanza di conoscenze sperimentali ap- 
profondite nel settore. 


— 


— _—__———€ 
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Tabella 13.2. Esempi di alcune malattie genetiche causate da alterazioni di un singolo gene 


Malattia Sintomi 


Malattie autosomiche recessive: 


Fibrosi cistica Infezioni ricorrenti del polmone, aumentata 
produzione di muco 

Deficienza della @,-antitripsina Alterazioni del fegato, enfisema 

Fenilchetonuria Ritardo mentale 

Sindrome di Tay-Sachs Degenerazione neuronale, cecità, paralisi 

Anemia falciforme Anemia 

Talassemia Anemia 


Malattie autosomiche dominanti 


Neurofibrimatosi di tipo I Tumori dei nervi periferici 

Malattia di Huntington Movimenti non controllati, ritardo mentale 
Distrofia miotonica Difetti del cuore e cataratte 
Retinoblastoma familiare Tumori dell’occhio 


Malattie legate al cromosoma X 


Emofilia Difetti della coagulazione del sangue 
Distrofia muscolare di Duschenne Degenerazione progressiva dei muscoli 
Sindrome dell’X fragile Ritardo mentale 


Terapia genica su cellule somatiche. Il genoma del paziente viene modificato, 
ma il cambiamento non può essere trasmesso alle generazioni successive. Le 
cellule somatiche possono essere modificate in vivo o ex vivo (Fig. 13.7). Nel 
primo caso, la terapia genica implica il cambiamento di un gene direttamente 
nel paziente; nel secondo caso, invece, si rimuovono alcune cellule dal pa- 
ziente, si coltivano e si modificano in vitro, prima di re-introdurle nel paziente 
stesso. 


Il tipo di terapia genica è collegato alle proprietà delle cellule che devono essere 
modificate. Se le cellule in cui si manifesta il difetto genetico possono essere facil- 
mente coltivate, allora la procedura ex vivo offre enormi vantaggi. Ad esempio, 
tutte le cellule del sangue derivano da cellule staminali pluri-potenti presenti nel 
midollo osseo. Queste cellule differiscono dalle cellule ES che abbiamo preceden- 
temente discusso, in quanto possono differenziarsi solo in un numero limitato di 
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Ex vivo 


Figura 13.7. Terapia genica umana in vivo e ex vivo. Vedere il testo per ulteriori dettagli 


tipi cellulari. Le cellule staminali pluri-potenti, tuttavia, possono essere coltivate in 
vitro per periodi molto lunghi e, quindi, malattie del sangue possono essere trattate 
ex vivo mediante l'isolamento e la coltura di cellule staminali dal midollo osseo. 
Queste cellule possono venire modificate in vitro e le cellule transgeniche possono 
essere re-introdotte nel paziente dove, eventualmente, saranno in grado di produrre 
le cellule differenziate che possono curare la malattia. Diverse tecniche, quali l’uti- 
lizzo di virus, l’iniezione diretta di DNA ed altri metodi descritti nel Capitolo 12, 
permettono di manipolare le cellule în vitro per inserire al loro interno il transgene. 
Altre cellule e tessuti sono meno facilmente manipolabili con tecniche ex vivo. Ad 
esempio, cellule epiteliali del polmone, la cui funzione è severamente alterata in 
pazienti affetti da fibrosi cistica, crescono molto male in coltura e, comunque, sa- 
rebbe poi molto difficile riuscire a sostituire le cellule malate con cellule transgeni- 
che modificate. In questi casi, quindi, la strada da seguire è la modificazione diretta 
delle cellule del paziente in vivo. Questo limita enormemente le strategie sperimen- 
tali: di solito si utilizzano virus, in particolare adenovirus, per trasportare il tran- 
sgene nelle cellule affette. 


13.5 Esempi e potenzialità della terapia genica 
La storia della terapia genica umana non è particolarmente felice. Con una sola im- 


portante eccezione (vedi più avanti), l’effetto dell’introduzione di un gene nelle 
cellule solo raramente promuove qualcosa di più di un effetto transitorio sui sin- 
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tomi della malattia. A peggiorare la situazione sono noti dei casi in cui il tratta- 
mento di terapia genica ha causato effetti secondari dannosi. Nel 1999, per esem- 
pio, Jessi Gelsinger, un volontario di Filadelfia che partecipava ad un monitoraggio 
clinico di terapia genica, è morto durante i trattamenti (Techler Zallen, 2000). Gel- 
singer, soffriva di una malattia legata al mal funzionamento dell’enzima ornitina 
transcarbamilasi (OTC), un raro difetto genetico del fegato che rende l’individuo 
affetto incapace di eliminare l’ammoniaca dal proprio sangue. Il paziente è stato 
trattato con un vettore adenovirale per cercare di re-inserire la copia normale del 
gene nelle sue cellule epatiche, ma il virus stesso ha determinato una violenta ri- 
sposta immunitaria che ne ha causato il decesso. Casi come questo sottolineano la 
necessità di sviluppare dei vettori capaci della massima efficienza di transfezione, 
ma privi di tossicità. 

Nonostante questi casi negativi, ci sono stati anche dei successi di terapia ge- 
nica. Bambini che soffrono di una deficienza immunitaria molto grave, denominata 
X-SCID, hanno una prognosi funesta se curati con metodi tradizionali. La malattia 
è causata da una mutazione nel gene, sul cromosoma X, che codifica per la catena 
gamma (7c) del recettore dell’interleuchina-2. Mutazioni nel gene impediscono il 
normale sviluppo di due tipi di globuli bianchi del sangue, le cellule T e le cellule 
killer naturali (Sugamura er al., 1996). La mancanza di difese immunitarie causata 
dalla malattia porta normalmente alla morte nel primo anno di vita, a meno che 
non si trovi un donatore di midollo osseo. 

Sono state raccolte le cellule staminali dal midollo osseo di un bambino affetto 
dalla malattia e le cellule sono state trattate con un retrovirus che portava la copia 
selvatica del gene yc (Cavazzana-Calvo et al., 2000). Quando le cellule staminali 
transgeniche sono state re-introdotte nel paziente, sono state in grado di generare 
tutte le cellule richieste per una normale risposta immunitaria per un periodo di al- 
meno 10 mesi (Fischer, Hacein-Bey e Cavazzana-Calvo, 2002). La rimozione delle 
cellule del midollo osseo dal corpo prima dell’infezione con il retrovirus ha elimi- 
nato il pericolo di una reazione acuta al virus stesso ed ha permesso di dirigere 
l'infezione virale solo sulle vere cellule bersaglio. Il ripopolamento del sistema im- 
munitario con un numero relativamente piccolo di cellule transgeniche del midollo 
può presentare altri problemi. Il trattamento, inoltre, seleziona per cellule prolife- 
ranti e può aumentare il rischio di tumori. È stato osservato che alcuni dei pazienti 
trattati in questo modo sviluppano delle leucemie (1 ogni 10 pazienti trattati con 
successo), che può essere attribuibile all'integrazione casuale del DNA esogeno nel 
genoma. In questo caso, il retrovirus aveva inserito il gene usato per la terapia ge- 
nica nella regione regolatrice di un gene sul cromosoma 11 chiamato Lmo2 (Gin- 
sbacher et al., 2003). L'attivazione del gene in esame causava l’espressione di 
Lmo2, un oncogene (Davenport, Neale e Goorha, 2000). Nonostante tutti questi 
problemi, gli esperimenti descritti rappresentano l’unico esempio in cui un pa- 
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ziente è stato guarito in modo apparentemente completo con tecniche di terapia ge- 
nica. 

Alcuni dei problemi connessi all’integrazione casuale del transgene durante la 
procedura possono essere risolti utilizzando sistemi che sfruttano i meccanismi di 
ricombinazione sito-specifica. Ad esempio, sono stati costruiti frammenti di DNA 
in cui il gene terapeutico era fiancheggiato dalle sequenze riconosciute da enzimi 
ricombinativi sito-specifici. Se questi frammenti di DNA vengono iniettati nelle 
vene della coda di topi insieme a frammenti di DNA che codificano per l’integrasi, 
allora si ottiene l’integrazione sito-specifica del transgene (Olivares et al., 2002). 
Questo sistema potrebbe essere sviluppato per renderlo adattabile all'uomo. 

Altri tentativi di terapia genica sono attualmente in corso per diverse malattie. 


* Emofilia B. I pazienti sono sprovvisti del gene per il fattore IX, una proteina im- 
portante nei processi di coaugulazione del sangue. I parvovirus sono stati utiliz- 
zati per inserire il gene mancante nelle cellule muscolari (High, 2001). Le cellule 
hanno riacquisito la capacità di sintetizzare il fattore, eliminando così la necessità 
di ricorrere ad iniezioni giornaliere della proteina stessa. 


* Cancro. Alcuni trattamenti contro il cancro sembrano idonei per l’utilizzo della 
terapia genica (Wadhwa er al., 2002). Vettori virali modificati possono essere 
usati per innescare la risposta immunitaria contro le cellule tumorali, mentre altri 
approcci sperimentali si basano sull’utilizzo di virus per trasportare geni ‘“sui- 
cidi” all’interno di cellule tumorali. 


e HIV. Il virus dell’HIV opportunamente modificato può essere utilizzato proprio 
per controllare infezioni causate da HIV-1 (Statham e Morgan, 1999). 


Attualmente le promesse della terapia genica rimangono per lo più disattese. Alte- 
razioni anche di un singolo gene possono causare una serie di difetti in diversi tipi 
cellulari. La correzione del difetto in alcune cellule può non essere sufficiente per 
curare la malattia. Tuttavia, lo sviluppo di nuove tecniche di trasferimento dei tran- 
sgeni, unito ad un miglioramento delle nostre conoscenze sulle cellule staminali, 
possono dare origine a nuovi approcci sperimentali per applicazioni cliniche della 
terapia genica. 


Glossario 


Adenina - base purinica che si trova nel DNA e nell’RNA. L’adenina può appaiarsi con la 
timina nel DNA e con l’uracile nell’ RNA 

alfa-complementazione - in mutanti di E. coli che esprimono una versione inattiva della f- 
galattosidasi, l’assemblaggio delle subunità e l’attività enzimatica possono essere ripri- 
stinati da un piccolo frammento N-terminale del prodotto di lacZ (il polipeptide a), di 
solito prodotto da un vettore di clonaggio 

Allele - una delle diverse possibili versioni di un gene in un locus cromosomico 

Animale transgenico - si crea tramite l’inserimento di sequenze di DNA nella linea ger- 
minale 

Antibiotico - una sostanza capace di inibire o bloccare la crescita batterica 

Anticodone - una tripletta di nucleotidi nel tRNA che porta un certo aminoacido e che si 
lega ad un codone complementare presente nel mRNA, durante la sintesi proteica sui ri- 
bosomi 

Anticorpo - una proteina prodotta da linfociti B che riconosce un antigene ed innesca la ri- 
sposta immunitaria 

Anticorpo monoclonale - una proteina altamente specifica che lega un singolo epitopo di 
un antigene 

Anticorpo policlonale - una miscela di molti anticorpi che sono stati prodotti contro lo 
stesso antigene 

Antigene - una sostanza o proteina capace di stimolare una risposta immunitaria 

BAC - cromosoma batterico artificiale 

Bermuda (principio di) - il rapido rilascio pubblico di sequenze di DNA, senza alcuna re- 
strizione d’uso 

Blastocisti - stadio iniziale dell’embrione che ha la forma di una cavità piena di liquido ri- 
coperta da uno strato di cellule 

Camminare sul cromosoma - l'isolamento sequenziale di cloni con sequenze di DNA par- 
zialmente sovrapposte che permette l’identificazione di grandi regioni del cromosoma a 
partire da un singolo punto di partenza 

Cariotipo - l'assetto cromosomico di un organismo 

eDNA - un singolo filamento di DNA che viene sintetizzato (e quindi è complementare) 
copiando una molecola di RNA 

Cellula staminale - cellule presenti nell’embrione, nel feto ed in cellule adulte che hanno 
la capacità di riprodursi e di dare origine a cellule specializzate che formano i tessuti e 
gli organi del corpo di un individuo 

Centrifugazione isopicnica - la separazione dei componenti di una miscela sfruttando le 
loro diverse densità 

Centromero - la regione sul cromosoma a cui si attaccano le fibre del fuso durante la mi- 
tosi e la meiosi 

Checkpoints del ciclo cellulare - sistemi che controllano la progressione del ciclo cellulare 
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Ciclo cellulare - il periodo che intercorre tra divisoni cellulari successive 

Citosina - una base pirimidinica del DNA e dell’RNA: la citosina si appaia con la guanina 

Clonaggio TA - un metodo per clonare prodotti di PCR che si basa sull’aggiunta terminale 
stampo-indipendente di residui di A ai prodotti di PCR da parte della Taq DNA polimerasi 

Clone - un organismo, cellula o molecola prodotta da un unico precursore 

Codone - la tripletta di nucleotidi che codifica per un aminoacido o per un segnale di ter- 
minazione della sintesi proteica 

Codone (utilizzo del) - la frequenza con cui i diversi codoni codificanti per un aminoacido 
sono utilizzati nella sintesi proteica 

Complementare - la sequenza di nucleotidi presente su un filamento di DNA a doppia 
elica si appaia con la sequenza dell’altro filamento seguendo le regole della comple- 
mentarietà delle basi: A con T e G con C 

Complementazione funzionale - l’identificazione di un gene utilizzando la sua capacità di 
mascherare il difetto causato da una mutazione del gene stesso 

Coniugazione - il trasferimento di tutto o parte del cromosoma durante l'accoppiamento 
tra batteri 

Contiguo - una sequenza continua di DNA prodotta da un numero di frammenti più piccoli 
parzialmente sovrapposti 

Coppia di basi - bp - la coppia di basi A-T o G-C in un DNA a doppio filamento 

Cosmide - un plasmide in cui sono stati inseriti i siti cos del fago lambda: come risultato, il 
DNA del plasmide può essere impacchettato nel capside del fago 

Cromatide - uno delle due strutture appaiate e parallele di un cromosoma duplicato unite 
da un unico centromero 

Cromatina (immunoprecipitazione di o ChIP) - un metodo per identificare proteine le- 
gate a particolari sequenze di DNA 

Cromosoma - un’unità discreta del genoma che è visibile come un'entità moffologica du- 
rante la divisione cellulare. Ciascun cromosoma è costituito da una singola molecola di 
DNA 

Denaturata (proteina) - la conversione di una proteina da una forma attiva (nativa) ad una 
forma inattiva (denaturata) 

Denaturato (DNA) - la conversione di DNA a doppio filamento in DNA a singolo fila- 
mento 

Dinucleotide - l'unione di due nucleotidi attraverso un legame fosfodiesterico 

Display differenziale - una tecnica per evidenziare differenze nell'espressione genica 

Display fagico - una tecnica che fonde peptidi a proteine del capside di fagi. Librerie di 
peptidi possono essere analizzate per il legame con specifici ligandi 

DNA - acido deossiribonucleico 

DNA emimetilato - DNA che contiene basi metilate solo su uno dei due filamenti 

DNA ligasi - l’enzima che catalizza la formazione del legame fosfodiesterico tra due ca- 
tene di DNA 

DNA polimerasi - l’enzima che catalizza la sintesi di nuove catene di DNA utilizzando un 
filamento di DNA come stampo 

DNA topoisomerasi - un enzima in grado di cambiare il numero di legame di molecole di 
DNA 

Effetto ipercromico - l'aumento in densità ottica che si verifica quando si forma DNA a 
singolo filamento (denaturazione) 


v 


GLOSSARIO 403 


Elettroforesi - l’applicazione di corrente elettrica per separare molecole (come DNA e pro- 
teine) attraverso un gel 

Elettroporazione - un metodo fisico per introdurre DNA in una cellula usando corrente 
elettrica. 

Enzima di restrizione - endonucleasi di restrizione - riconosce una breve sequenza nucleo- 
tidica, spesso palindromica, e taglia il DNA 

Episoma F - una molecola di DNA circolare ed extracromosomica a doppio filamento che 
porta i geni per la fertilità dei batteri 

Epitopo - la regione sulla superficie di un antigene in grado di innescare una risposta im- 
munitaria 

Esone - un segmento di gene che è rappresentato nell’mRNA maturo 

EST (expressed sequence tag) - un piccolo pezzo di sequenza di cDNA generato dal se- 
quenziamento di una estremità di un gene che viene espresso 

Eterocromatina - regioni del cromosoma altamente condensate e solitamente non trascrit- 
te 

Eterozigote - un individuo con alleli differenti ad un particolare locus cromosomico 

Eucromatina - la parte del genoma che contiene geni (inclusi introni ed esoni) 

Fago - batteriofago - un virus batterico 

Fago helper - provvede ad alcune funzioni che sono assenti in un fago difettivo, permet- 
tendo la replicazione del DNA virale durante un’infezione mista 

Fenotipo - le caratteristiche strutturali e funzionali di un organismo che si determinano 
come risultato dell'interazione tra genotipo ed ambiente 

Filamento anticipato (leading) - il filamento di DNA che, durante la replicazione, è sinte- 
tizzato in modo continuo in direzione 5°-3° 

Filamento ritardato (lagging) - il filamento di DNA che, durante la replicazione, è sinte- 
tizzato discontinuamente in piccoli frammenti che sono poi legati tra di loro 

FISH - ibridazione fluorescente in situ 

Gene - un’unità discreta d’informazione genetica che è richiesta per la produzione di un 
polipeptide o di un RNA. Include sequenze codificanti, promotori, terminatori e introni 

Genoma - il corredo genetico di un organismo 

Giunzione di Holliday - un importante intermedio che si forma durante la ricombina- 
zione 

Guanina - una base purinica del DNA e dell'RNA: si appaia con la citosina 

HAC - cromosoma artificiale umano 

Ibridazione - l’appaiamento tra acidi nucleici complementari (DNA-DNA 0 DNA-RNA) 

Inattivazione inserzionale - la distruzione della funzione di un gene inserendo sequenze di 
DNA al suo interno 

Ingegneria genetica - la modificazione mirata dei caratteri di un organismo attraverso la 
manipolazione del DNA e la trasformazione di certi geni 

Interferenza ad RNA (RNAi) - processo mediante il quale l’introduzione nella cellula di 
corti RNA a doppio filamento inibisce l’espressione genica 

Introne - un tratto di DNA che viene trascritto, ma è poi rimosso durante la maturazione 
del trascritto 

Isoschizomero - due diversi enzimi di restrizione che riconoscono la stessa sequenza ber- 
saglio 

Istone - una proteina che lega il DNA e che forma il nucleosoma 
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Knock-down genico - l’utilizzo di tecniche di silenziamento per ridurre o eliminare l’espres- 
sione di un certo gene 

Knock-out genico - la rimozione di un gene dal genoma 

Lariat - un intermedio nella reazione di splicing 

Legame fosfodiesterico - il legame covalente tra il gruppo fostato in 5’ di un nucleotide e 
l’ossidrile in 3° del nucleotide adiacente 

Libreria di cDNA - una collezione di molecole di cDNA a doppio filamento contenuta in 
un vettore 

Libreria genomica - una collezione di frammenti di DNA, derivata dal genoma di un orga- 
nismo, clonata in un vettore 

Lisi alcalina - un metodo per rompere le cellule batteriche ed isolare il DNA extracromo- 
somico 

Mappa citologica - un tipo di mappa cromosomica dove i geni sono localizzati in funzione 

dell’effetto che mutazioni cromosomiche possono avere sul bandeggio di colorazione 

dei cromosomi stessi 

Mappa di restrizione - una mappa lineare dei siti di restrizione di una molecola di DNA 

Marcatore genetico - qualunque sequenza di DNA che possa essere utilizzata per identifi- 

care un gene o una caratteristica fenotipica ad esso associata 

Metilato (DNA) - la modificazione di basi del DNA tramite l’aggiunta di gruppi metilici 
(CH,) 

Microarrays - un’area di reazioni miniaturizzate che può essere utilizzata per studi a li- 
vello d’interi genomi 

Microsatelliti - marcatori di DNA altamente polimorfici che comprendono un numero va- 
riabile di sequenze ripetute 

Mini-prep - purificazione di DNA extra-cromosomico (di solito DNA plasmidico) da una 
piccola coltura di cellule batteriche (di solito 1,5 ml) 

Monocistronico - una molecola di RNA che codifica per una proteina 

Morula - una massa solida globulare di cellule che deriva da divisioni successive dello zi- 
gote e che precede la blastula 

Mutagenesi tramite “scanning con alanina” - conversione degli aminoacidi di una pro- 

teina ad alanina per determinarne la funzione 

Mutazione frame-shift - si verifica quando la sequenza codificante di un gene contiene in- 

serzioni o delezioni di basi che non sono multiple di tre. Questo cambia il modulo di 

lettura in cui avviene la traduzione 

Mutazione per transizione - una mutazione nel DNA in cui una coppia purina-pirimidina 

viene cambiata in una coppia diversa dall’originale 

Mutazione per transversione - una mutazione in cui una coppia purina-pirimidina viene 

cambiata in una coppia pirimidina-purina 

Mutazione silente - una mutazione in un gene che non causa alcuna alterazione nella fun- 
zione della proteina da questo codificata 

Northern blot - una tecnica per la separazione di molecole di RNA su gel di agarosio, se- 
guita dall’identificazione di specifiche molecole di RNA tramite ibridazione con una 
sonda di DNA 

Nucleoside - una base purinica o pirimidinica combinata con il deossiribosio o il ribosio 
che si trovano nel DNA o RNA 

Nucleosoma - l’unità strutturale di base della cromatina 
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Nucleotide - una base purinica o pirimidinica combinata con il deossiribosio o il ribosio e 
il gruppo fosfato che si trovano nel DNA o RNA 

Oligonucleotide - una corta molecola di DNA a singolo filamento, di solito sintetizzata per 
via chimica 

Omologia - una similarità spesso attribuibuile ad un’origine comune 

Omozigote - un individuo con lo stesso allele ad un locus cromosomico 

Oocita - una cellula uovo prima della maturazione 

Operone lac - i geni richiesti in E. coli per metabolizzare il lattosio 

Opina - un prodotto generato dalla condensazione di un aminoacido con un cheto-acido 0 
uno zucchero 

Origine di replicazione - la sequenza nucleotidica in cui inizia la replicazione del DNA 

PAC - cromosoma artificiale derivato da PI. Un vettore basato sul genoma del batteriofago 
PI, usato per clonare grandi frammenti di DNA in E. coli 

Palindrome - una sequenza di DNA che risulta essere identica se letta in direzione 5°-3’ sui 
due filamenti di DNA 

PCR - polymerase chain reaction - cicli di denaturazione, appaiamento di primers e 
estensione con DNA polimerasi che portano all’amplificazione di sequenze specifiche 
di DNA 

PFGE - elettroforesi su gel in campo pulsato 

Pilus - una specie di filamento che fuoriesce dalla superficie di un batterio 

Pirimidina - una base azotata a singolo anello che si trova negli acidi nucleici. Le pirimi- 
dine nel DNA sono timina e citosina, nell’RNA sono uracile e citosina 

Plasmide - un elemento extra-cromosomico a doppio filamento circolare capace di repli- 
carsi autonomamente 

Policistronico - una molecola di mRNA che contiene l’informazione per più di una regione 
codificante 

Polinucleotide - lunghe catene di nucleotidi uniti da legami fosfodiesterici 

Polipeptide - una catena di aminoacidi uniti da legami peptidici 

Polisoma - l’insieme di ribosomi che stanno traducendo una singola molecola di mRNA in 
polipeptidi 

Primer - una corta sequenza di DNA o RNA che appaiandosi con un filamento di DNA, 
fornisce il 3’-OH da cui può iniziare la sintesi di DNA 

Principio trasformante - il fattore identificato da Griffith capace di convertire un tipo di 
batterio in un altro 

Promotore - Una sequenza di DNA che serve come sito di legame per fattori di trascri- 
zione e RNA polimerasi durante l’inizio della trascrizione 

Pronucleo - il nucleo aploide di una cellula germinale maschile o femminile prima della 
fecondazione e immediatamente prima che i nuclei dello spermatozoo e della cellula 
uovo si fondano in un unico nucleo diploide 

Propeller twist - la rotazione di coppie di basi all’interno della doppia elica 

Purina - una base azotata a doppio anello che si trova nel DNA. Le purine nel DNA e nel- 
RNA sono l’adenina e la guanina 

Quiescenza - una fase non proliferativa della crescita cellulare, dove la maggior parte delle 
attività della cellula vengono ridotte, normalmente in risposta ad un ambiente sfavore- 
vole. La cellula rimane quiescente finché le condizioni non ritornano idonee per la pro- 
liferazione 
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Replicazione conservativa - un modello, rivelatosi errato, in cui una molecola di DNA a dop- 
pio filamento fa da stampo per la sintesi di una nuova molecola di DNA a doppio filamento 

Replicazione dispersiva - un modello rivelatosi errato in cui molecole di DNA sono ca- 
sualmente formate durante la replicazione da frammenti della molecola madre e da 
frammenti neosintetizzati 

Replicazione semiconservativa - il modo in cui avviene la replicazione del DNA, per cui i 
due filamenti si separano e ciascuno funziona da stampo per la sintesi di un nuovo fila- 
mento complementare 

Replicone - parte del genoma replicato da una singola origine di replicazione 

Repressione da catabolita - la diminuita espressione di geni quando certi organismi ven- 
gono cresciuti in terreni contenenti glucosio 

RFLP - polimorfismo della lunghezza dei frammenti di restrizione - cambiamenti nella 
sequenza di DNA che originano frammenti di DNA di lunghezza diversa, dopo taglio 
con un enzima di restrizione 

Ribosoma - organelli ricchi di rRNA, dove avviene la sintesi proteica 

Ricombinazione omologa - scambio tra regioni omologhe di molecole di DNA 

Ricombinazione sito-specifica - avviene tra due specifiche sequenze di DNA, non neces- 
sariamente omologhe 

RNA - acido ribonucleico 

RNA polimerasi - l’enzima che sintetizza RNA su stampi di DNA 

RT-PCR - un metodo per l’amplificazione di uno specifico mRNA. La transcrittasi inversa 
è utilizzata per sintetizzare un cDNA, che viene poi amplificato tramite PCR 

Screening per doppio-ibrido - una tecnica per identificare proteine che interagiscono una 
con l’altra 

Sequenza di Shine-Dalgarno - una sequenza sull’mRNA dei procarioti che precede il co- 
done d’inizio della traduzione ed è complementare ad un RNA ribosomale 

Sequenza Kozak - la sequenza consenso per l’inizio della traduzione, con un sito di le- 
game per la subunità piccola del ribosoma 

Sequenza segnale - una corta sequenza di aminoacidi che determina la localizzazione di 
una proteina nella cellula 

siRNA - piccoli RNA inibitori - Piccole molecole sintetiche di RNA a doppio filamento 
che inibiscono l’espressione genica 

SNPs - polimorfismo di singolo nucleotide - variazioni di singole coppie di basi distribuite 
nel codice genetico degli individui di una popolazione 

Southern blot - tecnica per la separazione di molecole di DNA su gel di agarosio, seguita 
dal riconoscimento di specifiche molecole di DNA dopo denaturazione ed ibridazione 
con sonde di DNA a singolo filamento 

Spliceosoma - un complesso formato da RNA e da piccoli complessi di ribonucleoproteine 
nucleari (snRNPs). Lo spliceosoma è coinvolto nella maturazione dei trascritti primari, 
eliminando gli introni ed unendo tra loro gli esoni 

Splicing - la rimozione di introni e l’unione di esoni per formare gli mRNA maturi 

Superavvolgimento - il modo in cui molecole chiuse di DNA circolare ruotano attorno al 
proprio asse 

Switch genetico - il controllo della trascrizione in risposta a particolari segnali 

T-DNA - la porzione del plasmide Ti di Agrobacterium tumefaciens che viene inserita nel 
genoma della cellula vegetale 
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Tecnologia terminator - le piante coltivate ingegnerizzate che producono semi sterili 

Telomero - sequenze di DNA ripetute che si trovano alle estremità dei cromosomi 

Temperatura di melting (T,,,) - la temperatura alla quale il DNA viene denaturato al 50% 

Terminatore - la sequenza di DNA che controlla la fine della trascrizione da parte della 
RNA polimerasi 

Timina - una base pirimidinica presente nel DNA che si appaia con l’adenina 

Traduzione - la sintesi di proteine utilizzando mRNA come stampo 

Transcrittasi inversa - l’enzima che sintetizza DNA su stampi di RNA 

Transferasi terminale - un enzima che catalizza l’aggiunta di nucleotidi all'estremità 3’ di 
molecole di DNA 

Transfezione - l’aggiunta di DNA a cellule eucariotiche 

Trascrizione - la sintesi di RNA su stampi di DNA 

Trascrizione inversa - la sintesi di DNA da RNA 

Trasformazione - l’aggiunta di DNA a batteri. Negli eucarioti questo termine sta ad indi- 
care lo stato proliferativo che dà origine ad una crescita tumorale 

Trinucleotide - il legame di tre nucleotidi tramite legame fosfodiesterico 

Uracile - una base pirimidinica che si trova di solito soltanto nell’RNA. L’uracile può ap- 
paiarsi all’adenina 

Vettore - una molecola di DNA che possiede la capacità di autoreplicarsi. Si utilizza per in- 
trodurre DNA esogeno all’interno di cellule ospiti, dove si replica autonomamente e 
può essere isolato in grandi quantità 

Vettore d’espressione - un vettore di clonaggio costruito in modo tale che i geni in esso 
contenuti siano trascritti e tradotti 

Vettore di clonaggio - un plasmide o fago utilizzato per trasportare frammenti di DNA 
esogeno 

VNTRSs - variable number tandem repeats - sequenze di DNA ripetute in tandem un nu- 
mero variabile di volte presenti in uno specifico locus cromosomico 

Western blot - tecnica per riconoscere, dopo separazione tramite elettroforesi, specifiche 
proteine mediante l’utilizzo di anticorpi 

Xenobiotico - un composto con una struttura chimica estranea ad un organismo 

Xenotrapianto - trapianto chirurgico di un tessuto o organo da un individuo di una specie 
ad un individuo di una specie diversa 

YAC - cromosoma artificiale di lievito 

Zigote - la cellula che si forma dall’unione tra due gameti (spermatozoo e cellula uovo) 
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La struttura dei 20 amino acidi codificati dal codice genetico. 
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Catena laterale 
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A1.2 


L’a-elica e il B-sheet sono elementi frequentemente trovati nella struttura secondaria delle 
proteine. Le figure riportano un’a-elica del fattore trascrizionale Gen4p del lievito Saccha- 
romyces cerevisiae e un B-sheet che deriva dalla concanavalina A. In entrambe le figure 
sono mostrati: (A) il backbone (ossatura) del polipeptide e le catene laterali degli aminoa- 
cidi; (B) solo i residui del backbone polipeptidico; (C) una traccia del backbone polipepti- 
dico. 


L'a-elica 


Il B-sheet 
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A1.3 


Il codice genetico. Il codone della metionina che inizia la traduzione è indicato in verde ed 
i codoni di terminazione della traduzione sono indicati in rosso. 
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Vincitori di premi Nobel 


Un elenco di vincitori di premi Nobel il cui lavoro ha fortemente influenzato o è correlato 
agli argomenti discussi in questo libro. 


2002 

Sydney Brenner, H. Robert Horvitz e John E. Sulston, per le loro scoperte riguardanti la 
regolazione dello sviluppo di organi ed i meccanismi di morte cellulare programmata 
(Fisiologia e Medicina) 


2001 
Leland H. Hartwell, R. Tim Hunt e Paul M. Nurse, per le loro scoperte sui meccanismi 
di regolazione del ciclo cellulare (Fisiologia e Medicina) 


1999 
Gunter Blobel, per la scoperta che le proteine possiedono segnali intrinseci che regolano la 
loro localizzazione ed il trasporto nella cellula (Fisiologia e Medicina) 


1995 
Eward B. Lewis, Christiane Nusslein-Volhard e Eric F. Wieschaus, per le loro scoperte 
relative al controllo genetico dello sviluppo embrionale (Fisiologia e Medicina) 


1993 
Richard J. Roberts e Phillip A. Sharp, per la scoperta della natura discontinua dei geni 
negli eucarioti (Fisiologia e Medicina) 


Kary B. Mullis, per la scoperta del metodo della PCR — Polymerase Chain Reaction 
(Chimica) 


Michael Smith, per il suo contributo allo sviluppo della mutagenesi sito-specifica (Chi- 
mica) 


1989 
Sydney Altman e Thomas R. Chech, per la scoperta delle proprietà catalitiche dell’ RNA 
(Chimica) 


J. Michael Bishop e Harold, E. Varmus, per la scoperta dell’origine retrovirale degli on- 
cogeni (Fisiologia e Medicina) 


1987 
Susumo Tonegawa, per la scoperta della base genetica della diversità degli anticorpi 
(Fisiologia e Medicina) 
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1985 
Michael S. Brown e Joseph L. Goldstein, per le loro scoperte sulla regolazione del meta- 
bolismo del colesterolo (Fisiologia e Medicina) 


1984 

Niels K. Jerne, Georges J.F. Kohler e Cèsar Milstein, per le teorie riguardo lo sviluppo 
ed il controllo del sistema immunitario e per la scoperta del principio alla base della produ- 
zione di anticorpi monoclonali (Fisiologia e Medicina) 


1983 
Barbara McClintock, per la scoperta degli elementi genetici mobili (Fisiologia e Medicina) 


1982 

Aaron Klug, per lo sviluppo di metodologie cristallografiche, di microscopia elettronica 
e per la determinazione della struttura di importanti complessi proteina-acidi nucleici 
(Chimica) 


1980 
Paul Berg, per i suoi studi sulla biochimica degli acidi nucleici, con particolare riguardo 
alle tecnologie del DNA ricombinante 


Walter Gilbert e Frederick Sanger, per il loro contributo allo sviluppo di tecnologie per 
la determinazione delle sequenze degli acidi nucleici (Chimica) 


1978 
Werner Arber, Daniel Nathans e Hamilton O. Smith, per la scoperta degli enzimi di 
restrizione e le loro applicazioni alla genetica molecolare (Fisiologia e Medicina) 


1975 
David Baltimore, Renato Dulbecco e Howard M. Temin, per le loro scoperte sulle inte- 
razioni tra virus tumorali e materiale genetico della cellula (Fisiologia e Medicina) 


1972 
Christian B. Anfinsen, per il suo lavoro sulla ribonucleasi, in particolare sulle connessioni 
tra sequenze di aminoacidi ed attività biologica 


Stanford Moore e William H. Stein, per i loro contributi alla connessione tra struttura chi- 
mica ed attività catalitica del centro attivo della ribonucleasi (Chimica) 


1969 
Max Delbruck, Alfred D. Hershey e Salvador E. Luria, per le loro scoperte riguardo ai 
meccanismi di replicazione e sulla struttura dei virus (Fisiologia e Medicina) 


1968 ‘ 
Robert W. Holley, Har Gobind Khorana e Marshall W. Nirenberg, per la comprensione 
del codice genetico e la sua funzione nella sintesi delle proteine (Fisiologia e Medicina) 
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1966 
Peyton Rous, per la sua scoperta dei virus che inducono tumori (Fisiologia e Medicina) 


1965 
Francois Jacob, Andrè L. Woff e Jaques Monod, per le loro scoperte sul controllo gene- 
tico della sintesi di enzimi e virus (Fisiologia e Medicina) 


1964 
Dorothy C. Hodgkin, per la determinazione di importanti strutture biochimiche con la 
tecnica dei raggi X (Chimica) 


1962 

Francis H.C. Crick, James, D. Watson e Maurice H.F. Wilkins, per la scoperta della 
struttura degli acidi nucleici ed il significato del trasferimento dell’informazione negli orga- 
nismi viventi (Fisiologia e Medicina) 


Max F. Perutz e John C. Kendrew, per i loro studi sulla struttura delle proteine (Chimica) 


1959 
Severo Ochoa e Arthur Kornberg, per le loro scoperte sui meccanismi di sintesi biologica 
dell’RNA e del DNA 


1958 
George W. Beadle e Edward L. Tatum, per la scoperta che i geni agiscono regolando 
specifici eventi chimici 


Joshua Ledeberg, per le sue scoperte sui meccanismi di ricombinazione e l’organizza- 


zione del materiale genetico nei batteri (Fisiologia e Medicina) 


Frederick Sanger, per il suo lavoro sulla struttura delle proteine, in particolare sulla strut- 
tura proteica dell'ormone dell’insulina (Chimica) 


1957 
Alexander R. Todd, per il suo lavoro sui nucleotidi e sui co-enzimi (Chimica) 


1954 
Linus C. Pauling, per la ricerca sulla natura del legame chimico e la sua applicazione alla 
comprensione della struttura di sostanze complesse (Chimica) 


1946 
James B. Summer, per la scoperta che gli enzimi possono essere cristallizzati 


. John H. Northrop e Wendell M. Stanley, per la purificazione di enzimi e proteine virali 
(Chimica) 
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Hermann J. Muller, per la scoperta della produzione di mutazioni mediante trattamento 
con raggi X (Fisiologia e Medicina) 


1933 
Thomas H. Morgan, per la scoperta del ruolo dei cromosomi nei meccanismi ereditari (Fi- 
siologia e Medicina) 


1902 
H. Emil Fisher, per il suo lavoro sugli zuccheri e la sintesi di purine (Chimica) 


- ———— P— 
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Analisi dei Geni e Genomi è una introduzione molto chiara 

alle basi teoriche e pratiche di ingegneria genetica, di clonaggio 
di geni e di biologia molecolare. Nel testo vengono affrontati 
tutti gli aspetti dell'ingegneria genetica nell'era della post- 
genomica, a cominciare dalle basi della struttura 

e del metabolismo del DNA. Facendo ricorso ad un approccio 
guidato da esempi, vengono presentati, in maniera chiara 

ed esaustiva, i fondamenti della creazione di mutazioni nel DNA, 
del clonaggio nei batteri, nei lieviti, nelle piante e negli animali. 


Per aiutare gli studenti a comprendere e ad analizzare l'enorme 


quantità di dati oggi disponibile grazie ai progetti di 
sequenziamento del genoma e delle funzioni dello stesso, 
sono state introdotte le più moderne tecnologie, come i micro- 
e macro-array di DNA, la proteomica e la bioinformatica. 


Rivolto soprattutto agli studenti in possesso delle conoscenze 
di base degli aspetti molecolari della biologia, il presente testo 
sarà altresì prezioso per coloro i quali vorranno far luce sulle 
complessità e le potenzialità di queste importanti tecnologie 
moderne. 


e Una moderna introduzione alle tecniche chiave usate in ingegneria genetica 
e Un esempio di approccio guidato dal passato al presente, per far sì che 

gli esperimenti di oggi possano essere collocati in contesti storici. 
e Ricco di numerose illustrazioni a colori 


